Куча (структура данных)

В информатике ку́ча (англ. heap) — это специализированная структура данных типа дерево, которая удовлетворяет свойству кучи: если B является узлом-потомком узла A, то ключ(A) ≥ ключ(B). Из этого следует, что элемент с наибольшим ключом всегда является корневым узлом кучи, поэтому иногда такие кучи называют max-кучами (в качестве альтернативы, если сравнение перевернуть, то наименьший элемент будет всегда корневым узлом, такие кучи называют min-кучами). Не существует никаких ограничений относительно того, сколько узлов-потомков имеет каждый узел кучи, хотя на практике их число обычно не более двух. Куча является максимально эффективной реализацией абстрактного типа данных, который называется очередью с приоритетом. Кучи имеют решающее значение в некоторых эффективных алгоритмах на графах, таких, как алгоритм Дейкстры на d-кучах и сортировка методом пирамиды.

Структуру данных куча не следует путать с понятием куча в динамическом распределении памяти. Впервые термин использовался именно для структур данных. В некоторых ранних популярных языках программирования типа ЛИСП обеспечивалось динамическое распределение памяти с использованием структуры данных «куча», которая и дала своё имя выделяемому объёму памяти.^[1].

Кучи обычно реализуются в виде массивов, что исключает наличие указателей между её элементами.

Над кучами обычно проводятся следующие операции:

найти максимум или найти минимум: найти максимальный элемент в max-куче или минимальный элемент в min-куче, соответственно
удалить максимум или удалить минимум: удалить корневой узел в max- или min-куче, соответственно
увеличить ключ или уменьшить ключ: обновить ключ в max- или min-куче, соответственно
добавить: добавление нового ключа в кучу.
слияние: соединение двух куч с целью создания новой кучи, содержащей все элементы обеих исходных.

Варианты[править | править код]

Сравнение теоретических оценок вариантов[править | править код]

Ниже приведены оценки временно́й сложности вычислений для операций над некоторыми видами кучи.^[1] Там, где значение отмечено звездочкой, оценка сделана методом амортизационного анализа (по наихудшему времени), в остальных случаях оценка является регулярным худшим случаем. O(F) даёт асимптотическую верхнюю границу, а Θ(F) является асимптотически точной оценкой (см. обозначения «O» большое и «o» малое). Имена операций выбраны для min-кучи.

Операция	Двоичная	Биномиальная	Фибоначчиева	Спаренная^[2]	Бродал
найти минимум	Θ(1)	Θ(log n) or Θ(1)	Θ(1)^[1]	Θ(1)	Θ(1)
удалить минимум	Θ(log n)	Θ(log n)	O(log n)*	O(log n)*	O(log n)
добавить	Θ(log n)	O(log n)	Θ(1)	O(1)*	Θ(1)
уменьшить ключ	Θ(log n)	Θ(log n)	Θ(1)*	O(log n)*	Θ(1)
слияние	Θ(n)	O(log n)**	Θ(1)	O(1)*	Θ(1)

(*) Амортизационное время
(**) Где n — размер наибольшей кучи

Заметим, что «очередь Бродала» представляет собой реализацию очереди с параллельным приоритетом, разработанную группой во главе с Гертом Бродалом.^[3]

Применение[править | править код]

Структуры данных типа кучи имеют множество применений.

Пирамидальная сортировка: один из лучших применяемых методов сортировки, не имеющий квадратичных наихудших сценариев.
Алгоритмы поиска: при использовании кучи поиск минимума, максимума, того и другого, медианы или k-го наибольшего элемента может быть сделан за линейное время (часто даже за константное время).^[4]
Алгоритмы на графах: Применение кучи в качестве структуры данных для внутреннего обхода даёт сокращение времени выполнения на полиномиальный порядок. Примерами таких проблем являются алгоритм построения минимального остовного дерева Прима и проблема кратчайшего пути Дейкстры.

Полная и почти полная бинарная куча может быть представлена очень эффективным способом с помощью индексного массива. Первый (или последний) элемент будет содержать корень. Следующие два элемента массива содержат узлы-потомки корня. Следующие четыре элемента содержат четверых потомков от двух узлов — потомков корня, и т. д. Таким образом, потомки узла уровня n будут расположены на позициях 2n и 2n+1 для массива, индексируемого с единицы, или на позициях 2n+1 и 2n+2 для массива, индексируемого с нуля. Это позволяет перемещаться вверх или вниз по дереву, выполняя простые вычисления индекса массива. Балансировка кучи делается перестановкой элементов, которые нарушают порядок. Поскольку мы можем построить кучу с помощью массива без дополнительной памяти (для узлов, например), то можно использовать пирамидальную сортировку для сортировки массива прямо на месте.

Реализации[править | править код]

Стандартная библиотека шаблонов языка C++ предоставляет шаблоны функций для управления кучей make_heap, push_heap и pop_heap (обычно реализуются бинарные кучи), которые оперируют с итераторами произвольного доступа. Методы используют итераторы как ссылки на массивы и выполняют преобразование массив-куча.
Набор шаблонов Java платформы Java 2 (начиная с версии 1.5) предоставляет реализацию бинарной кучи в классе java.util.PriorityQueue<E>.
Python имеет модуль heapq, который реализует очереди с приоритетами с помощью бинарной кучи.^[5]
Начиная с версии 5.3 PHP в стандартной библиотеке имеются методы maxheap (SplMaxHeap) и minheap (SplMinHeap).
В Perl имеются реализации бинарной, биномиальной и фибоначчиевой кучи во всеобъемлющей сети архивов.^[6]

См. также[править | править код]

Примечания[править | править код]

↑ ¹ ² ³ Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest (1990): Introduction to algorithms. MIT Press / McGraw-Hill.
↑ Iacono, John (2000), "Improved upper bounds for pairing heaps", Proc. 7th Scandinavian Workshop on Algorithm Theory, Lecture Notes in Computer Science, vol. 1851, Springer-Verlag, pp. 63—77, doi:10.1007/3-540-44985-X_5
↑ A Parallel Priority Queue with Constant Time Operations (PDF) {{citation}}: Игнорируется текст: "web" (справка) Источник (неопр.). Дата обращения: 31 мая 2011. Архивировано 26 июля 2011 года.
↑ Frederickson, Greg N. (1993), "An Optimal Algorithm for Selection in a Min-Heap", Information and Computation (PDF), vol. 104, Academic Press, pp. 197—214, doi:10.1006/inco.1993.1030 Источник (неопр.). Дата обращения: 31 мая 2011. Архивировано 3 декабря 2012 года.
↑ Python heapq (неопр.). Дата обращения: 31 мая 2011. Архивировано 18 октября 2012 года.
↑ Perl Heap

[CLRS-1] ¹ ² ³ Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest (1990): Introduction to algorithms. MIT Press / McGraw-Hill.

[Iacono-2] Iacono, John (2000), "Improved upper bounds for pairing heaps", Proc. 7th Scandinavian Workshop on Algorithm Theory, Lecture Notes in Computer Science, vol. 1851, Springer-Verlag, pp. 63—77, doi:10.1007/3-540-44985-X_5

[3] A Parallel Priority Queue with Constant Time Operations (PDF) {{citation}}: Игнорируется текст: "web" (справка) Источник (неопр.). Дата обращения: 31 мая 2011. Архивировано 26 июля 2011 года.

[4] Frederickson, Greg N. (1993), "An Optimal Algorithm for Selection in a Min-Heap", Information and Computation (PDF), vol. 104, Academic Press, pp. 197—214, doi:10.1006/inco.1993.1030 Источник (неопр.). Дата обращения: 31 мая 2011. Архивировано 3 декабря 2012 года.

[5] Python heapq (неопр.). Дата обращения: 31 мая 2011. Архивировано 18 октября 2012 года.

[6] Perl Heap

[1]

[2]

[3]

[4]

[5]

[6]

Структуры данных
Типы	Коллекция Контейнер
Абстрактные	Ассоциативный массив Многомерный ассоциативный массив Список Стек Очередь Двухсторонняя очередь Очередь с приоритетом Двухстороняя очередь с приоритетом Множество Мультимножество Система непересекающихся множеств
Массив	Битовая карта Кольцевой буфер Динамический массив Хеш-таблица Дерево хеш-таблицы^[en] Разреженная матрица
Связные^[en]	Ассоциативный список Связный список Список с пропусками Развёрнутый связный список Односвязный список Двусвязный список XOR-связный список
Деревья	B-дерево Двоичное дерево поиска AA-дерево^[en] AVL-дерево Красно-чёрное дерево Самобалансирующееся двоичное дерево поиска^[en] Splay-дерево Куча Двоичная куча Биномиальная куча Фибоначчиева куча R-дерево R*-дерево R+-дерево^[en] R-дерево Гильберта Префиксное дерево Hash tree^[en]
Графы	Бинарная диаграмма решений Ориентированный граф Ориентированный ациклический граф Гиперграф

Куча (структура данных)

Содержание

Варианты[править | править код]

Сравнение теоретических оценок вариантов[править | править код]

Применение[править | править код]

Реализации[править | править код]

См. также[править | править код]

Примечания[править | править код]

Навигация

Куча (структура данных)

Варианты[править | править код]

Сравнение теоретических оценок вариантов[править | править код]

Применение[править | править код]

Реализации[править | править код]

См. также[править | править код]

Примечания[править | править код]

Навигация

Поиск