Hierarchical Data Format

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Hierarchical Data Format
Изображение логотипа
Расширение .hdf, .h4, .hdf4, .he2, .h5, .hdf5 или .he5
MIME-тип application/x-hdf[2] и application/x-hdf5[3]
Сигнатура \211HDF\r\n\032\n
Разработчик The HDF Group
Последний выпуск 5-1.10.1[1] (27 апреля 2017; 6 лет назад (2017-04-27))
Тип формата семейство файловых форматов[d]
Открытый формат? Да
Сайт hdfgroup.org/solu… (англ.)

Hierarchical Data Format, HDF (Иерархический формат данных) — название формата файлов, разработанного для хранения большого объема цифровой информации. Первоначально был разработан Национальным центром суперкомпьютерных приложений, сейчас поддерживается некоммерческой организацией HDF Group.

Библиотеки для работы с форматом и связанные с ним утилиты доступны для использования под свободной лицензией, схожей с лицензией BSD. Формат HDF поддерживается многими коммерческими и некоммерческими программами, в том числе есть библиотеки для работы с ним в Java, Matlab, Scilab, Octave, Mathematica, IDL  (англ.), Python, R и Julia. Свободно распространяемый пакет HDF состоит из библиотеки, утилиты командной строки, исходных текстов для тестирования, интерфейса для Java и Java-программы для просмотра HDF-файлов.

HDF4[править | править код]

HDF4 — старая версия формата, однако все еще активно поддерживаемая HDF Group. Он поддерживает различные модели данных, включая многомерные массивы, растровые изображения и таблицы.

Использует 32-битные целые числа, поэтому имеет проблемы с хранением больших объёмов информации (более нескольких гигабайт).

HDF5[править | править код]

HDF5 — современная версия формата. Получил премию R&D100 от журнала "R&D Magazine" в 2002 году.[4]

Содержит иерархию из двух основных типов объектов:

Пример структуры HDF
  • Datasets — наборы данных, многомерные массивы объектов одного типа
  • Groups — группы, являются контейнерами для наборов данных и других групп

Содержимое файлов HDF5 организовано подобно иерархической файловой системе, и для доступа к данным применяются пути, сходные с POSIX-синтаксисом, например, /path/to/resource. Метаданные хранятся в виде набора именованных атрибутов объектов.

Формат NetCDF 4 основан на HDF5.

Для индексации используются Б-деревья.

Примечания[править | править код]

Ссылки[править | править код]