Теплокарта

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Теплокарта — это графическое представление данных, где дополнительные переменные отображаются при помощи цвета.

Подобные системы иерархичной кодировки цветов используются в изображениях фракталов и других системах представления данных. Термином «теплокарта» так же иногда называют картограммы. Термин «теплокарта» изначально придуман и официально зарегистрирован как товарный знак разработчиком программного обеспечения Кормаком Кинни в 1991 году. Он использовал этот термин, чтобы описать 2D дисплей, изображающий в режиме реального времени информацию финансового рынка.[1]

История создания[править | править вики-текст]

Теплокарта, порожденная из микрочиповых данных, отражающих уровни экспрессии генов в некоторых условиях

Теплокарты берут начало от 2D дисплеев, показывающих значения в таблице. Крупные значения представлялись небольшими темно-серыми или черными квадратиками (пикселями), а меньшие значения — более светлыми квадратами. Снит в 1957 продемонстрировал результаты кластерного анализа с помощью перестановки строк и колонок матрицы, чтобы разместить похожие значения рядом друг с другом в соответствии с кластеризацией. Жак Бертэн использовал аналогичное представление для отображения данных, которые соответствовали шкале Гуттмана. Идея соединения иерархической кластеризации в виде деревьев со строкам и столбцам таблицы возникла у Роберта Линга в 1973 году. Линг, используя надпечатки символов принтера, изображал различные оттенки серого, один символ шириной в один пиксель. Леланд Уилкинсон в 1994 году разработал первую программу (SYSTAT) для изображения кластерных тепловых карт с цветной графикой высокого разрешения. Дисплей Эйзена и др., показанный на рисунке, является повторением дизайна ранней SYSTAT.

Виды тепловых карт и применение[править | править вики-текст]

Карта-дерево
  • Веб тепловые карты используются как инструменты для веб-аналитики. Они показывают наиболее посещаемые области веб-страницы.
  • Биологические тепловые карты обычно используются в молекулярной биологии и медицине для представления данных по экспрессии множества генов в различных образцах, полученных, например, от разных пациентов или в разных условиях от одного пациента. Обычно организована в виде таблицы, в которой цвет квадрата показывает уровень экспрессии, а столбцы и строки различные гены или образцы, иерархическая организация которых может быть изображена в виде дерева на полях таблицы.
  • Карта-дерево — это 2D иерархическое представление данных, визуально напоминающее тепловую карту.
  • Мозаичный график — мозаичная теплокарта для представления дву- или более составной таблицы данных. Как и карта-дерево, прямоугольные области в мозаичном графике организованы иерархически.

Использование цветов[править | править вики-текст]

Существует множество различных цветовых схем со своими недостатками и преимуществами, которые используются в теплокартах. Часто используются теплокарты с большим количеством цветов (радужные), так как люди способны различать большее число разнообразных оттенков цвета, нежели различать серый разной интенсивности. Это позволяет разбирать и замечать больше деталей изображения. Тем не менее, многие ученые не рекомендуют использовать такие слишком цветные карты по следующим причинам:[2][3][4][5]

  • Широко распространенные цветовые схемы (например, jet, которая используется по умолчанию во многих программах для визуализации данных) слишком яркие для того, чтобы корректно отобразить их в черно-белом спектре или печати. Так же на таких цветовых схемах желтые и голубые области более заметны, что отвлекает наблюдателя от главного.
  • Маленькая разница между цветами заставляет нас видеть градиенты, которых на самом деле нет, что делает реальные градиенты менее заметными. Тем самым радужные цветовые схемы скрывают детали, а не делают их более явными.

Программное обеспечение[править | править вики-текст]

Теплокарта, построенная программой Gnuplot
Теплокарта, показывающая расположение игроков футбольной команды на поле в течение матча. Красный цвет — области поля, где наиболее часто присутствовали игроки, желтые — реже.
Теплокарта, построенная в Excel

Ниже перечислены некоторые программы, которые чаще всего используют для построения теплокарт.

  • PermutMatrix — рабочая среда, предназначенная для графического исследования наборов числовых данных. Предлагает набор методов для оптимальной реорганизации строк и столбцов таблиц.[6]
  • NeoVision Hypersystems — программа фирмы, основанной Кормаком Кинни, и финансируемой Intel и Deutsche Bank. Тепловые карты описывают в режиме реального времени финансовые данные и расчеты, производимые более чем 50000 пользователями.[7]
  • R Статистика — бесплатное программное обеспечение для статистических вычислений и построения графиков, содержит несколько функций для построения тепловых карт.[1]
  • Gnuplot — универсальная и бесплатная программа, в которой можно строить как 2D, так и 3D тепловые карты.[2]
  • Приложение для работы с электронными таблицами Google Docs включает в себя инструмент «Тепловая карта», но он разработан только для данных по странам.
  • Цветовая схема Дэйва Грина cubehelix, предназначенная для перевода в черно-белое изображение без потери информативности[3].
  • Qlucore — биоинформатическая программа для анализа данных экспрессии, включает в себя построение теплокарт.
  • Программа ESPN Gamecast для футбольных игр использует теплокарты, чтобы показать области поля, где находились игроки во время игры.
  • Визуализатор таблиц GENE-E включает в том числе инструмент для изображения теплокарт.
  • Microsoft Excel можно использовать для получения теплокарт, применяя диаграмму поверхности. Но по умолчанию диапазон цветов не подходит для теплокарты, цвета могут быть отредактированы для создания удобных и интуитивно понятных тепловых карт.
  • Sightsmap (или теплокарта «туристичности»)- строит теплокарту популярности достопримечательностей. Для этого берутся фотографии с сайта Panoramio, который приписывает каждой фотографии ее географические координаты, и рисуется теплокарта на Google Maps по количеству фотографий в определенной географической точке. Например, жёлтые зоны — много снимков (и туристов соответственно), серые зоны — нет снимков.
  • Heat Maps — популярный сайт биржевой торговли для начинающих инвесторов. Это единственный бесплатный сайт, который позволяет полностью настраивать списки акций для отслеживания при помощи теплокарт.

Примеры теплокарт[править | править вики-текст]

Альтернативы[править | править вики-текст]

Для отображения трехмерных данных в двумерном пространстве в качестве третьей переменной можно использовать не только цвет, но и другие графические средства.

Пузырьковая диаграмма[править | править вики-текст]

В качестве третьего измерения используется площадь или размер круга.

Гистограмма[править | править вики-текст]

В гистограмме значения переменных представлены в виде высоты столбцов. Дополнительные измерения можно получить, добавив новые столбцы на график. В данном типе представления данных очень наглядно и заметно выглядят максимальные значения, но меньшие значения теряются, остаются фоном.

Картограмма[править | править вики-текст]

Изображение на географической карте в качестве третьей переменной различных данных: высота над уровнем моря, плотность населения, тип растительности, климат, административные границы.

Примечания[править | править вики-текст]

  1. 1 2 «United States Patent and Trademark Office, registration #75263259». 1993-09-01.
  2. 1 2 Borland, D., & Taylor, M. R. (2007). Rainbow Color Map (Still) Considered Harmful. IEEE Computer Graphics and Applications, 27(2), 14-17. IEEE Computer Society. Retrieved from http://www.ncbi.nlm.nih.gov/pubmed/17388198
  3. 1 2 How NOT to Lie with Visualization — Bernice E. Rogowitz and Lloyd A. Treinish — IBM Thomas J. Watson Research Center, Yorktown Heights, NY
  4. Mark Harrower1and Cynthia A. Brewer — ColorBrewer.org: An Online Tool for Selecting Colour Schemes for Maps, The Cartographic Journal Vol. 40 No. 1 pp. 27-37 June 2003
  5. Green, D. A., 2011, `A colour scheme for the display of astronomical intensity images', Bulletin of the Astronomical Society of India, 39, 289. Dave Green’s `cubehelix' colour scheme
  6. Caraux, Gilles; Pinloche S. (2005). «PermutMatrix: a graphical environment to arrange gene expression profiles in optimal linear order». Bioinformatics. 7 21: 1280—1281.
  7. Sansoni, Silvia (1999-05-17). «Forbes Magazine Article on NeoVision Heatmaps»

См. также[править | править вики-текст]