Канонический корреляционный анализ

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Канонический корреляционный анализ (ККА, англ. Canonical Correlation Analysis, CCA) — это способ получения информации из матриц взаимной корреляции[en]. Если у нас есть два вектора и случайных величин, и имеются корреляции среди этих переменных, тогда канонический корреляционный анализ найдёт линейную комбинацию X и Y, которая имеет максимум корреляции[1]. Т. Р. Кнапп заметил, что «практически все общеупотребительные параметрические тесты[en] значимости могут трактоваться как специальный случай канонического корреляционного анализа, который является общей процедурой для исследования связей между двумя наборами переменных»[2]. Первым метод представил Гарольд Хотеллинг в 1936[3].

Определение[править | править код]

Если даны два вектор-столбца[en] и случайных величин с конечными вторыми моментами, можно определить взаимную корреляцию[en] как матрицу, элементы которой являются ковариациями . На практике мы оцениваем ковариационную матрицу, основываясь на выборочных данных из и (т.е. из пары матриц данных).

Канонический корреляционный анализ ищет вектора ( ) и (), такие что случайные величины и максимизируют корреляцию . Случайные величины и являются первой парой канонических переменных. Затем ищутся вектора, максимизирующие ту же корреляцию с ограничением, что они не коррелируют с первой парой канонических переменных, это даёт вторую пару канонических переменных. Эта процедура может продолжаться до раз.

Вычисление[править | править код]

Вывод[править | править код]

Пусть и . Максимизируемый параметр

На первом шаге осуществляем замену базиса[en] и определяем

Тогда мы имеем

По неравенству Коши — Буняковского мы получим

Неравенство превращается в равенство, если вектора и коллинеарны. В дополнение, максимум корреляции достигается, когда является собственным вектором с максимальным собственным значением для матрицы (см. Отношение Рэлея). Следующая пара находится при использовании следующего по величине собственного значения. Ортогональность гарантируется симметрией корреляционных матриц.

Решение[править | править код]

Решение:

  • является собственным вектором
  • пропорционально

Соответственно, также

  • является собственным вектором
  • пропорционально

При обратном изменении координат получаем

  • является собственным вектором ,
  • пропорционально
  • является собственным вектором
  • пропорционально .

Канонические переменные определяются равенствами:

Имплементация[править | править код]

ККА может быть вычислен с помощью сингулярного разложения корреляционной матрицы[4]. Каноническая корреляция доступна как функция в следующих системах[5].

Проверка гипотез[править | править код]

Каждая строка проверяется на значимость с помощью следующего метода. Поскольку корреляции отсортированы, из утверждения, что строка нулевая, вытекает, что все дальнейшие корреляции также равны нулю. Если мы имеем независимых наблюдений в выборке и является расчётной корреляцией для , для -ой строки критерием значимости будет:

которое асимптотически распределено как хи-квадрат с степенями свободы для больших [6]. Поскольку все корреляции от до равны нулю, произведение членов после этой точки не имеют значения.

Практическое использование[править | править код]

Типичное использование канонической корреляции в экспериментальном контексте заключается в рассмотрении двух наборов переменных и изучении, что общего в этих двух наборах [7]. Например, в психологических исследованиях можно взять два установившихся многофакторных личностных теста[en], таких как Миннесотский многоаспектный личностный опросник (MMPI-2) и NEO. Рассматривая, как факторы MMPI-2 относятся к факторам NEO, можно обнаружить, какие характеристики оказались общими для двух тестов и насколько переменные являются общими. Например, можно обнаружить, что такие характеристики, как экстраверсия или невротизм, составляют существенную часть общих переменных для двух тестов.

Можно также использовать канонический корреляционный анализ для получения равенства, которое связывает два набора переменных, например, набора измерений производительности и набора объясняющих переменных, или набора выхода и набора входа. На такую модель могут быть наложены ограничивающие условия для обеспечения теоретических или интуитивно очевидных требований. Этот тип модели известен как модель максимальной корреляции[8].

Визуализация результатов канонической корреляции осуществляется обычно через столбцовый график коэффициентов двух наборов переменных для пар канонических переменных, показывающий значимую корреляцию. Некоторые авторы предлагают, что лучше визуализировать результаты на гелиографе, который представляет собой круговой график с лучами в виде столбцов, половина из которых представляет один набор переменных, а другая половина — второй набор[9].

Примеры[править | править код]

Пусть с нулевым математическим ожиданием, т.е. . Если , т.е. и полностью коррелированны, тогда, к примеру, и , так что первая (только для этого примера) пара канонических переменных равна и . Если , т.е. и полностью антикоррелированны, то и , так что первая (только для этого примера) пара канонических переменных равна и . Заметим, что в обоих случаях , что показывает, что канонический корреляционный анализ работает с коррелированными переменными точно так же, как и с антикоррелированными.

Связь с главными углами[править | править код]

Предположим, что и имеют нулевые математические ожидания, т.е. . Их ковариационные матрицы и можно рассматривать как матрицы Грама со скалярным произведением для и соответственно. В такой интерпретации случайные величины, элементы вектора и элементы вектора , трактуются как элементы векторного пространства со скалярным произведением, задаваемым ковариацией .

Определение канонических переменных и тогда эквивалентно определению корневых векторов для пар подпространств, натянутых на и , с учётом этого скалярного произведения. Каноническая корреляция равна косинусу угла между подпространствами.

Отбеливание и вероятностный канонический корреляционный анализ[править | править код]

ККА можно также рассматривать как специальное отбеливающее преобразование[en][10], где случайные вектора и одновременно преобразуются таким образом, что матрица взаимной корреляции между отбеленными векторами и является диагональной[11].

Канонические корреляции тогда интерпретируется как коэффициенты регрессии, связывающие , и и они могут быть отрицательнымиe. Взгляд на ККА как на регрессию даёт способ построения латентной переменной порождающей вероятностной модели для ККА с некоррелируемыми скрытыми переменными, представляющими общую и частную дисперсию.

См. также[править | править код]

Примечания[править | править код]

  1. Härdle, Simar, 2007, с. 321–330.
  2. Knapp, 1978, с. 410–416.
  3. Hotelling, 1936, с. 321–377.
  4. Hsu, Kakade, Zhang, 2012, с. 1460.
  5. Huang, Lee, Hsiao, 2009, с. 2162.
  6. Mardia, Kent, Bibby, 1979.
  7. Sieranoja, Sahidullah, Kinnunen, Komulainen, Hadid, 2018.
  8. Tofallis, 1999, с. 371–378.
  9. Degani, Shafto, Olson, 2006, с. 93.
  10. Отбеливающе преобразование преобразует вектор случайных величин с помощью линейного преобразования в белый шум
  11. Jendoubi, Strimmer, 2018.

Литература[править | править код]

Ссылки[править | править код]