Hierarchical Data Format

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Hierarchical Data Format, HDF (Иерархический формат данных) — название формата файлов, разработанного для хранения большого количества цифровой информации. Первоначально был разработан Национальным центром суперкомпьютерных приложений, сейчас поддерживается некоммерческой организацией HDF Group.

Библиотеки для работы с форматом и связанные с ним утилиты доступны для использования под свободной лицензией, схожей с лицензией BSD. Формат HDF поддерживается многими коммерческими и некоммерческими программами, существуют библиотеки для работы с ним из Java, Matlab, IDL и Python. Свободно распространяемый пакет HDF состоит из библиотеки, утилиты командной строки, исходных текстов для тестирования, интерфейса для Java и Java-программы для просмотра HDF-файлов.

HDF4[править | править исходный текст]

HDF4 — старая версия формата, однако все еще активно поддерживаемая HDF Group. Он поддерживает различные модели данных, включая многомерные массивы, растровые изображения и таблицы.

Использует 32-битные целые числа, поэтому имеет проблемы с хранением больших объёмов информации (более нескольких гигабайт).

HDF5[править | править исходный текст]

HDF5 — современная версия формата. Получил премию журнала "R&D Magazine" в 2002 году.[1]

Содержит иерархию из двух основных типов объектов:

HDF-Structure-Example
  • Datasets — наборы данных, многомерные массивы объектов одного типа
  • Groups — группы, являются контейнерами для наборов данных и других групп

Содержимое файлов HDF5 организовано подобно иерархической файловой системе, и для доступа к данным применяются пути, сходные с POSIX-синтаксисом, например, /path/to/resource. Метаданные хранятся в виде набора именованных атрибутов объектов.

Формат NetCDF 4 основан на HDF5.

Для индексации используются Б-деревья.

Примечания[править | править исходный текст]

Ссылки[править | править исходный текст]