Критерий Краскела — Уоллиса

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона — Манна — Уитни. Критерий Краскела — Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Известен также под названиями: H-критерий Краскела — Уоллиса, однофакторный дисперсионный анализ Краскела — Уоллиса (англ. Kruskal — Wallis one-way analysis of variance), тест Крускала — Уоллиса (англ. Kruskal — Wallis test). Назван в честь американских математиков Уильяма Краскела и Аллена Уоллиса.

Примеры задач[править | править код]

Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом «Каковы шансы на победу сборной России?» до начала чемпионата. Вторая выборка — после первой игры, третья — после второго матча и т. д. Значения в выборках — шансы России на победу по десятибалльной шкале (1 — «никаких перспектив», 10 — «отвезти в Россию кубок — дело времени»). Требуется проверить, зависят ли результаты опросов от хода чемпионата.

Описание критерия[править | править код]

Заданы выборок:

.

Объединённая выборка будет иметь вид:

Дополнительные предположения:

  1. все выборки простые, объединённая выборка независима;
  2. выборки взяты из неизвестных непрерывных распределений .

Проверяется нулевая гипотеза при альтернативе .

Упорядочим все элементов выборок по возрастанию и обозначим ранг -го элемента -й выборки в полученном вариационном ряду.

Статистика критерия Краскела — Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид:

,

где

;
.

Гипотеза сдвига отклоняется на уровне значимости , если , где  — критическое значение, при и вычисляемое по таблицам. При бо́льших значениях применимы различные аппроксимации.

Аппроксимация Краскела — Уоллиса[править | править код]

Пусть

;
;
;
.

Тогда статистика будет иметь при отсутствии сдвига -распределение с и степенями свободы. Таким образом, нулевая гипотеза отклоняется на уровне значимости , если .

Аппроксимация Имана — Давенпорта[править | править код]

В соответствии с ней нулевая гипотеза сдвига отклоняется с достоверностью , если , где ; , и  — соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.

Это более точная аппроксимация, чем аппроксимация Краскела — Уоллиса. При наличии связанных рангов (то есть когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику , где ;  — размер -й группы одинаковых элементов;  — количество групп одинаковых элементов. При справедлива аппроксимация распределения статистики ; -распределением с степенями свободы, то есть нулевая гипотеза отклоняется, если .

См. также[править | править код]

Литература[править | править код]

  • Kruskal W. H., Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — pp. 583—621.
  • Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
  • Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.

Ссылки[править | править код]