Software-defined storage

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Программно определяемые хранилища (Software-defined storage, SDS) - это следующий шаг в развитии программного обеспечения по организации хранения данных для управления услугами хранения на основе бизнес-ориентированных политик (правил) независимо от аппаратного обеспечения. Различные определения программно определяемых хранилищ обычно включают виртуализацию хранилищ для отделения аппаратного обеспечения от программного, которое управляет инфраструктурой хранения. Программное обеспечение, включающее программно-определяемую среду хранения, может так же обеспечивать управление на основе политик такими функциями, как дедупликация, репликация, снапшоты, бэкапы, тонкое резервирование (thin provisioning, это когда сумма выделенных виртуальных ресурсов больше, чем их физически доступное количество). Программно-определяемые (Software Defined) иногда сравнивают с программно-базирующимися (Software Based) хранилищами.

По общему мнению и в соответствии с изначальной трактовкой программное обеспечение SDS отделено от аппаратного обеспечения, которым оно управляет. Это аппаратное обеспечение может иметь абстракции функций хранения (таких как RAID, репликация и др.), объединение в пулы или средства автоматизации, но это не является обязательным условием. Этот философский размах делает сложным классификацию программно-определяемых хранилищ (SDS). Реализации с использованием только программного обеспечения и серийного серверного оборудования с внутренними дисками для хранения могут соответствовать такому программному обеспечению, как виртуальная или глобальная файловые системы (virtual or global file system). Если это программное обеспечение лежит поверх сложных больших массивов хранения, оно соответствует такому программному обеспечению, как виртуализация хранения (storage virtualization) или менеджмент ресурсов хранения (storage resource management), категориям продуктов, предназначенным для решения разных не связанных друг с другом задач. Если функции управления и политик (правил) внутри программно-определяемого хранилища также включают форму искусственного интеллекта для автоматизации функций защиты и восстановления, оно может считаться интеллектуальной абстракцией. Программно-определяемые хранилища могут быть реализованы поверх традиционных сетей хранения данных (Storage Area Network, SAN), или реализованы как часть масштабных сетевых хранилищ данных (Network Attached Storage, NAS), или как основа объектного хранилища. В марте 2014 SNIA начала проект технической работы, доступной для публичного изучения, о программно определяемых хранилищах (SDS).

Основанные на таких же концепциях, как и программно-определяемые сети (software-defined networking, SDN), интерес к SDS вырос после приобретения в 2012 году компанией VMware за более, чем миллиард долларов, известной SDN от Nicira.

Ряд компаний использует фразу "программно определяемое хранилище" в различных интерпретациях для продвижения своих уже существующих или планируемых продуктов.

VMware, которая купила Nicira, использует термин "программно-определяемый датацентр" для описания более широкой концепции, в которой все виртуализированные хранилища, сервера, сетевые ресурсы и ресурсы безопасности, необходимые приложениям, могут быть определены программным обеспечением и выделены автоматически. Другие маленькие компании адаптируют термин "программно определяемое хранилище" под себя, как Coraid в мае 2013.

В продолжение тренда программно-определяемых хранилищ, определение SDS постоянно плавает. Это связано с тем, что производители систем хранения данных выходят с их собственными определениями, которые соответствуют их собственным продуктам.

Характеристики программно-определяемых хранилищ[править | править код]

Характеристики программно-определяемых хранилищ могут включать отдельные или все следующие качества:

  1. Абстрагирование логики услуг хранения и совместимости от нижележащих физических систем хранения, в различных реализациях. Поскольку перемещение данных относительно дорого и медленно по сравнению с вычислительными операциями (проблема "гравитации данных" в инфономике), подходы объединения ресурсов в пулы иногда позволяют уйти от этого и создать слой отображения для них, который объединит массивы. Примеры включают:
    • Виртуализация систем хранения данных, обобщающая категория подходов и исторически возникших продуктов. Массивы на основе внешних контроллеров включают виртуализацию хранения для управления использованием и доступом в отличие от устройств с их собственными пулами. Другие продукты существуют независимо для управления массивами и/или серверами систем хранения данных с прямым подключением (Direct-attached storage).
    • Виртуальные тома (vVols), предложенные VMware для более прозрачного отображения между большими объемами и дисковыми образами виртуальных машин, позволяют оптимизировать производительность и улучшить управление данными. Это не дает ничего нового администраторам виртуальной инфраструктуры (которые и так могли уже использовать, например, NFS), но это дает возможность использовать массивы, построенные на ISCSI или Fibre Channel, как путь к более высокоуровневому администрированию для приложений, написанных для управление массивами хранения в виртуальной инфраструктуре.
    • Параллельные NFS (pNFS) - это специфичная реализация, которая эволюционировала из NFS сообщества, но разраслась до множества реализаций.
    • OpenStack и его Swift и Cinder API для взаимодействие с хранилицем, который был реализован как для открытых проектов, так и для продуктов вендоров.
  2. Автоматизация на основе политико-предоставляемых услуг хранения с соглашением об уровне предоставляемых услуг приходят на смену технологическим деталям. Это требует управляющих интерфейсов, которые объединят в пучок традиционные продукты организации массивов хранения, в духе отделения "плоскости управления" от "плоскости данных" в OpenFlow. Основные усилия индустрии по стандартизации включая Инициативы управления хранения (Storage Management Initiative - Specification, SMI-S), начали прикладываться в 2000 году.
  3. Серийное оборудование с логикой хранения абстрагированной в программном слое. Это также описывается как кластерная файловая система для конвергентного хранения. Примеры с открытым исходным кодом включают в себя: GlusterFS, Ceph, VMware Virtual SAN
  4. Высокомасштабируемая архитектура хранения данных.