Контентно-адресуемое хранилище данных

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Content-addressable storage (CAS) — архитектура хранения, в которой адресация осуществляется образом хранимых данных. Образ данных хэшируется и хэш используется для его нахождения на устройствах или системах хранения.

Архитектура обладает большой устойчивостью к дубликатам, а также может быть выполнена децентрализованно, что даёт ей существенную надёжность.

Является персистентным аналогом контентно-адресуемой памяти.

Принцип CAS[править | править исходный текст]

В отличие от традиционных дисковых систем (файловая, блоковая адресация), размещение информации производится не по имени файла или конкретному сектору на поверхности диска, а по его содержимому. Для каждого объекта (им может быть файл, блок данных, либо иной поток информации) вычисляется контрольная сумма (MD5, SHA-256 и т.д) – своего рода «отпечаток пальца», - которая и является адресом размещения информации. И по этому же адресу объект впоследствии может быть прочитан из устройства. В житейском представлении это напоминает не совсем обычный ломбард, учитывающий объекты, в первую очередь, не по их названиям (как в традиционных файловых системах), а, например, по особенной исключительно-уникальной стоимости, которую он подбирает оценивая объекты при приеме их на хранение, и которая в дальнейшем послужит такому ломбарду идентификатором при поиске объекта среди других для выдачи его обратно. Если за время хранения к объекту что-то добавили или наоборот отняли, то вместе с этим этот ломбард произведет переоценку изменив его идентификационную стоимость.

Свойства CAS-устройств[править | править исходный текст]

Неизменяемость данных[править | править исходный текст]

Сама архитектора системы гарантирует неизменность хранимой информации. Если какой-либо объект был изменен, то у него будет уже другая контрольная сумма, и это будет уже другой объект, хранимый по другому адресу. При обращении по старому адресу объект будет прочтён в гарантированно первозданном виде, что исключает подмену, подделку и иные подобные действия, что неоценимо в области юриспруденции, безопасности, хранения ключевых доказательств и др.

Срок хранения (Retention)[править | править исходный текст]

Для каждого из записанных объектов может быть установлен определенный срок хранения, в течение которого он не может быть удалён. Этот срок может составлять от нескольких минут до нескольких лет, а также неограниченное хранение. В последнем случае удаление файла возможно только на заводе-изготовителе, либо только физическим уничтожением устройства. Причем начало срока хранения не обязательно исчисляется с текущего момента, а может начинаться с любого определенного или даже неопределённого момента в будущем, как например хранение истории болезни в течение трёх лет с даты смерти пациента, которая на данный момент неизвестна.

Соответствие стандартам (Compliance)[править | править исходный текст]

Для нашей страны это пока ещё только зарождающаяся тенденция (как например указания Центробанка по сроку и требованиям хранения банковских документов [1][2]), однако во всем мире уже немало стандартов (таких как SEC 17a-4, HIPAA, 21CPR Part 11, DoD 5015.2 и др.), которые устанавливают срок и особенности хранения определенных файлов законодательно. Как следует из предыдущих пунктов, CAS-устройства способны справиться с этой задачей, что подтверждается сертификатами соответствия стандартам, позволяющими использовать их в определенных сферах.[3] [4]

Авторизированное и сертифицированное удаление.(Audited delete, Reflections)[править | править исходный текст]

Удаление объекта в устройстве не происходит бесследно. Помимо того, что для этого могут потребоваться определённые права доступа, а также авторизация вышестоящего руководства, после удаления объекта остается определенная информация о факте удаления, а также о связанных с ним объектах и персонах. Так например устройство позволяет создать хранилище записей камер видеонаблюдения, которое позволяет установить был ли факт наличия/отсутствия определенных записей, а также пользователей, причастных к их удалению.

Единственность копии (Single Instance Storage)[править | править исходный текст]

Следствием архитектуры CAS является ещё одна интересная особенность: в случае если записываются несколько одинаковых файлов, но под разными именами, то реально будет записан только один объект, т.к. контрольные суммы – и следовательно, адреса размещения всех объектов совпадут, что значительно экономит дисковое пространство. Однако же при чтении каждый файл будет читаться под своим именем.

Прочие[править | править исходный текст]

Помимо перечисленных особенностей, CAS-устройства имеют и стандартные для дисковых устройств функции такие как масштабируемость, Web-интерфейс, RAID, репликация, shredding, развитые возможности мониторинга, диагностики, оповещения о неисправностях, а также обширные функции индексации, поиска по содержимому и пользовательским мета-данным.

Применение устройств CAS[править | править исходный текст]

Исходя из перечисленных свойств устойства CAS получили распространение для архивного хранилища, а также для концепции «активного архива» (например при использовании ПО «Disk Extender», «E-Mail Extender»), в которых неиспользуемые данные незаметно для пользователя перемещаются на более дешевое архивное хранилище, заменяясь ссылкой на оригинальный файл, по которой его может прочесть пользователь, не подозревающий об его реальном местонахождении.

Примеры устройств CAS[править | править исходный текст]

Конкретные реализации CAS-устройств представлены продуктами:

  • ”Centera” фирмы EMC
  • ”HCP” (“Hitachi Content Platform”) компании Hitachi, ранее имевшее название ”HCAP” (“Hitachi Content Archive Platform”).
  • "HP StorageWorks Reference Information Storage System" (RISS) Hewlett-Packard
  • "Sun StorageTek 5800 System" Sun Storagetek

Примечания[править | править исходный текст]

  1. Инструкция N 9 по делопроизводству ЦБ РФ 1.
  2. Перечень документов, образующихся в деятельности центрального банка российской федерации, с указанием сроков хранения (утв. цб рф 23.06.1994 n 97)
  3. http://www.emc.com/collateral/hardware/data-sheet/c1034-centera-compliance-sol.pdf
  4. http://www.hds.com/assets/pdf/regulatory-compliance-and-hitachi-content-platform-solution-profile.pdf

См. также[править | править исходный текст]

Ссылки[править | править исходный текст]