Критерий Уилкоксона

Т-критерий Вилкоксона — (также используются названия Т-критерий Уилкоксона, критерий Вилкоксона, критерий знаковых рангов Уилкоксона, критерий суммы рангов Уилкоксона) непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных или независимых измерений по уровню какого-либо количественного признака, измеренного в непрерывной или в порядковой шкале. Впервые предложен Фрэнком Уилкоксоном^[1]. Другие названия — W-критерий Вилкоксона^[2], критерий знаковых рангов Вилкоксона, критерий Уилкоксона для связных выборок^[3]. Тест Вилкоксона для независимых выборок также называется критерием Манна-Уитни^[4].

Суть метода состоит в том, что сопоставляются абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Назначение критерия[править | править код]

Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.

Описание критерия[править | править код]

Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10—15 % от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно различаются между собой и принимают какие-то конечные значения (например. +1, -1 и 0), формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.

Суть метода состоит в том, что сопоставляются абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.

Минимальное значение величины: $W=n(n+1)/2$ , где n — объём второй выборки. Максимальное значение величины $W=n(n+1)/2+mn$ , где n — объём второй выборки, m — объём первой выборки.

Ограничения критерия[править | править код]

Уверенно критерий Уилкоксона можно использовать при объёме выборки до 25 элементов^[5]. Это объясняется тем, что при большем числе наблюдений распределение значений данного критерия стремительно приближается к нормальному. Поэтому в случае с большими выборками прибегают к преобразованию критерия Уилкоксона в величину z (z-score)^[5]. Примечательно, что программа SPSS конвертирует критерий Уилкосона в величину z всегда независимо от размеров выборки^[5].

Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)

Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.

Есть также урезанный вариант для сравнения одной выборки с известным значением медианы.

Алгоритм[править | править код]

Составить список испытуемых в любом порядке, например, алфавитном.
Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.
Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчётной.
Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.
Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.

Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.

Пример алгоритма для серии из двух опытов[править | править код]

Пусть имеется две серии эксперимента, в результате которых были получены две выборки объёмами n и m. Пусть нулевая гипотеза H₀: Генеральные средние обеих выборок совпадают. Чтобы проверить гипотезу H₀, необходимо:

Просуммировать элементы второй выборки (вычислить W)
Вычислить математическое ожидание случайной величины W. $M(W)=n(m+n+1)/2$
При справедливости H₀ математическое ожидание случайной величины W близко к статистике W.
Проверка гипотезы начинается с выбора уровня значимости — а
Вычислить пределы значимости (Из симметрии достаточно одного предела) и границу критической области W(a)
Справедливость неравенства W > W(a) свидетельствует о справедливости нулевой гипотезы. H₀ принимается на уровне значимости = а

Примечания[править | править код]

↑ Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics, 1, 80-83.
↑ W критерий Уилкоксона (неопр.). Дата обращения: 10 декабря 2013. Архивировано 8 декабря 2013 года.
↑ Критерий Уилкоксона для связных выборок (неопр.). Дата обращения: 28 марта 2011. Архивировано 26 мая 2012 года.
↑ Chris Wild. The Wilcoxon Rank-Sum Test (неопр.). CHANCE ENCOUNTERS: A First Course in Data Analysis and Inference. John Wiley & Sons, New York (1999). Дата обращения: 7 сентября 2018. Архивировано 27 января 2019 года.
↑ ¹ ² ³ Graham Hole. Nonparametric tests with large sample sizes (неопр.). Дата обращения: 21 апреля 2017. Архивировано 12 июля 2017 года.

[1] Wilcoxon, F. (1945). Individual comparisons by ranking methods. Biometrics, 1, 80-83.

[2] W критерий Уилкоксона (неопр.). Дата обращения: 10 декабря 2013. Архивировано 8 декабря 2013 года.

[3] Критерий Уилкоксона для связных выборок (неопр.). Дата обращения: 28 марта 2011. Архивировано 26 мая 2012 года.

[4] Chris Wild. The Wilcoxon Rank-Sum Test (неопр.). CHANCE ENCOUNTERS: A First Course in Data Analysis and Inference. John Wiley & Sons, New York (1999). Дата обращения: 7 сентября 2018. Архивировано 27 января 2019 года.

[Large_Sample_Size-5] ¹ ² ³ Graham Hole. Nonparametric tests with large sample sizes (неопр.). Дата обращения: 21 апреля 2017. Архивировано 12 июля 2017 года.

[1]

[2]

[3]

[4]

[5]

Критерий Уилкоксона

Содержание

Назначение критерия[править | править код]

Описание критерия[править | править код]

Ограничения критерия[править | править код]

Алгоритм[править | править код]

Пример алгоритма для серии из двух опытов[править | править код]

Примечания[править | править код]

Навигация

Критерий Уилкоксона

Назначение критерия[править | править код]

Описание критерия[править | править код]

Ограничения критерия[править | править код]

Алгоритм[править | править код]

Пример алгоритма для серии из двух опытов[править | править код]

Примечания[править | править код]

Навигация

Поиск