Многомерное шкалирование: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
м викификация, стилевые правки
Строка 1: Строка 1:
{{Underlinked|date=апрель 2016}}
{{Underlinked|date=апрель 2016}}
'''Многомерное шкалирование''' — метод [[Анализ данных|анализа и визуализации данных]] с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в [[Многомерное пространство|пространстве]] меньшей размерности чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от эмпирически измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы матрицы расстояний получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Мера различий расстояний в исходном и новом пространстве называется функцией стресса.
'''Многомерное шкалирование''' — метод [[Анализ данных|анализа и визуализации данных]] с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в [[Многомерное пространство|пространстве]] меньшей [[Размерность пространства|размерности]], чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от [[Эмпирические исследования|эмпирически]] измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы [[Матрица расстояний|матрицы расстояний]] получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Мера различий расстояний в исходном и новом пространстве называется функцией стресса.


== Области применения ==
== Области применения ==
* Поиск скрытых переменных, объясняющих полученную из опыта структуру попарных расстояний между изучаемыми явлениями.
* Поиск [[Скрытые переменные|скрытых переменных]], объясняющих полученную из опыта структуру попарных расстояний между изучаемыми явлениями.
* Проверка гипотез о расположении изучаемых явлений в пространстве скрытых переменных.
* Проверка гипотез о расположении изучаемых явлений в пространстве скрытых переменных.
* Сжатие полученного опытным путём массива данных путём использования небольшого числа скрытых переменных.
* Сжатие полученного опытным путём массива данных путём использования небольшого числа скрытых переменных.
Строка 9: Строка 9:


== Функция расстояния ==
== Функция расстояния ==
Функцией расстояния называется функция от двух аргументов, которая двум шкалируемым объектам ставит в соответствие расстояние <math>d(a_i, a_j)</math> между ними так, что выполняются следующие аксиомы: <math>d(a_i, a_j)=0</math> в том и только том случае, когда объекты <math>a_i</math> и <math>a_j</math> совпадают (рефлексивность расстояния), <math>d(a_i, a_j)=d(a_j, a_i)</math> (симметричность расстояния), <math>d(a_i, a_j)+d(a_j, a_k) \geqslant d(a_i, a_k)</math> (правило треугольника).
Функцией расстояния называется функция от двух аргументов, которая ставит в соответствие двум шкалируемым объектам расстояние <math>d(a_i, a_j)</math> между ними так, что выполняются следующие аксиомы: <math>d(a_i, a_j)=0</math> в том и только том случае, когда объекты <math>a_i</math> и <math>a_j</math> совпадают (рефлексивность расстояния), <math>d(a_i, a_j)=d(a_j, a_i)</math> (симметричность расстояния), <math>d(a_i, a_j)+d(a_j, a_k) \geqslant d(a_i, a_k)</math> (правило треугольника).


== Функция близости ==
== Функция близости ==

Версия от 14:40, 2 июня 2021

Многомерное шкалирование — метод анализа и визуализации данных с помощью расположения точек, соответствующих изучаемым (шкалируемым) объектам, в пространстве меньшей размерности, чем пространство признаков объектов. Точки размещаются так, чтобы попарные расстояния между ними в новом пространстве как можно меньше отличались от эмпирически измеренных расстояний в пространстве признаков изучаемых объектов. Если элементы матрицы расстояний получены по интервальным шкалам, метод многомерного шкалирования называется метрическим. Когда шкалы являются порядковыми, метод многомерного шкалирования называется неметрическим. Мера различий расстояний в исходном и новом пространстве называется функцией стресса.

Области применения

  • Поиск скрытых переменных, объясняющих полученную из опыта структуру попарных расстояний между изучаемыми явлениями.
  • Проверка гипотез о расположении изучаемых явлений в пространстве скрытых переменных.
  • Сжатие полученного опытным путём массива данных путём использования небольшого числа скрытых переменных.
  • Наглядное представление данных.

Функция расстояния

Функцией расстояния называется функция от двух аргументов, которая ставит в соответствие двум шкалируемым объектам расстояние между ними так, что выполняются следующие аксиомы: в том и только том случае, когда объекты и совпадают (рефлексивность расстояния), (симметричность расстояния), (правило треугольника).

Функция близости

Функция близости менее формализована, так как она является опытной величиной, например, получаемой в ходе социологического опроса. Это функция от двух аргументов, которая двум шкалируемым объектам ставит в соответствие расстояние между ними так, что выполняются следующие аксиомы: (объект ближе к самому себе, чем к любому другому объекту), (симметричность близости), для больших значений и величина имеет по крайней мере тот же порядок (ослабленное правило треугольника).

Литература

  • Толстова Ю.Н. Основы многомерного шкалирования. — М.: КДУ, 2006. — 160 с. — ISBN 5-98227-100-4.
  • Дэйвисон М. Многомерное шкалирование: методы наглядного представления данных. — М.: Финансы и статистика, 1988. — 254 с. — ISBN 5-279-00276-3.
  • Айвазян С.А., Бухштабер В.М, Енюков И.С. и др. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 607 с.