Топологический анализ данных

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Топологический анализ данных — новая область теоретических исследований для задач анализа данных (Data mining) и компьютерного зрения.

Основные вопросы:

  1. Как из низкоразмерных представлений получать структуры высоких размерностей;
  2. Как дискретные единицы складываются в глобальные структуры.

Человеческий мозг легко строит представление об общей структуре по частным данным низких размерностей. Ему, например, не составляет труда получить трехмерную форму объекта по плоским изображениям в каждом глазу. Создание общей структуры также производится при объединении дискретных во времени фрагментов в непрерывный образ. Так, например, телевизионное изображение технически является массивом отдельных точек, который, однако, воспринимается как единая сцена.

Основной метод топологического анализа данных:

  1. Замена набора элементов данных некоторым семейством симплициальных комплексов в соответствии с параметром близости.
  2. Анализ этих топологических комплексов с помощью алгебраической топологии, а конкретно новой теорией устойчивых гомологий.
  3. Перекодировка устойчивой гомологии набора данных в параметризованную версию чисел Бетти, далее называемую штрихкодом.

Облако точек[править | править вики-текст]

Данные часто представлены множеством точек в Евклидовом пространстве En, форма которого отражает описываемый данными феномен..

Реальные трехмерные объекты могут представляться в виде облака точек. Например лазером отмечаются отдельные точки и их неструктурированный набор служит представлением объекта в компьютере. Облаком точек считается любой (возможно зашумленный) набор точек в En или проекций точек в более низкой размерности.

В компьютерной графике и статистике есть различные методы построения прообразов по проекциям. Топологический анализ данных предназначен для пространств высоких размерностей или слишком искривленных чтобы создавать по ним плоские проекции.

Для преобразования облака точек в метрическом пространстве в целостный объект точки используются в качестве вершин графа ребрам которого приписаны расстояния, затем граф превращается в симплициальный комплекс и изучается средствами алгебраической топологии.

Устойчивая гомология[править | править вики-текст]

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]