Критерий Вальда — Вольфовица

Критерий Вальда — Вольфовица (тест периодов, тест прогонов, критерий серий Вальда-Вольфовица), названный в честь статистиков Абрахама Вальда и Джейкоба Вольфовица, представляет собой непараметрический статистический тест, который проверяет гипотезу о случайности для двух последовательностей данных одинаковой длины. Точнее, данный критерий можно использовать для проверки нулевой гипотезы о том, что элементы двух последовательностей взаимно независимы.

Определение[править | править код]

Прогон последовательности — это максимальный непустой сегмент последовательности, состоящий из соседних равных элементов. Если последовательность действительно случайна, то прогонов не должно быть слишком мало, но и не должно быть слишком много.

Например, последовательность длиной в 22 элемента

+ + + + − − − + + + − − + + + + + + − − − −

состоит из 6 прогонов, 3 из которых состоят из «+», а остальные из «−». Тест прогонов основан на нулевой гипотезе о том, что каждый элемент в последовательности независимо берется из одного и того же распределения.

Согласно нулевой гипотезе, количество прогонов в последовательности из N элементов ^{[прим. 1]} является случайной величиной, условное распределение которой, учитывая наблюдение N₊ положительных значений ^{[прим. 2]} и N₋ отрицательных значений ^{[прим. 3]} (N = N₊ + N₋), является приблизительно нормальным, при этом ^[1]^[2] математическое ожидание $\mu ={\frac {2\ N_{+}\ N_{-}}{N}}+1$ , дисперсия $\sigma ^{2}={\frac {2\ N_{+}\ N_{-}\ (2\ N_{+}\ N_{-}-N)}{N^{2}\ (N-1)}}={\frac {(\mu -1)(\mu -2)}{N-1}}$ .

Эти параметры не предполагают, что положительные и отрицательные элементы имеют равные вероятности появления, а только предполагают, что элементы независимы и одинаково распределены. Если количество прогонов значительно выше или ниже ожидаемого, гипотеза о статистической независимости элементов может быть отклонена.

Применение[править | править код]

Тест прогонов может быть использован, чтобы проверить:

Случайность распределения данных в последовательности. Таким образом данные проверяются на предмет стационарности или отсутствие корреляции во временном ряду или другой последовательности, особенно если распределение признака неизвестно. Нулевая гипотеза здесь заключается в том, что последовательные значения некоррелированы. Данные выбираются из последовательности в порядке их следования: знаком «+» отмечаются данные равные или превышающие медиану; знаком «–» — данные меньшие медианы.
Насколько хорошо функция соотносится с датасетом. Данные, превышающие значение функции, отмечаются знаком «+», остальные данные отмечаются знаком «–». В этом случае тест прогонов, учитывающий знаки, но не расстояния, является дополнением к критерию хи-квадрат, который учитывает расстояния, но не знаки — обе контрольные величины асимптотически независимы друг от друга.

Пример проверки на случайность распределения данных[править | править код]

Рассмотрим последовательность

13	 3	14	14	1	14	3	8	14	17	9	14	13	2	16	1	3	12	13	14

Отнесем каждое значение данной последовательности к одной из 2 групп («+» или «–») с учетом того больше оно или меньше медианы = 13

0	-10	1	1	-12	1	-10	-5	1	4	-4	1	0	-11	3	-12	-10	-1	0	1

+	-	+	+	-	+	-	-	+	+	-	+	+	-	+	-	-	-	+	+

При N₊ = 11 и N_- = 9 получается r = 13 прогонов.

R приблизительно нормально распределено с математическим ожиданием $\mu ={\frac {(2\cdot 11\cdot 9)}{20}}+1=10{,}9$ и дисперсией $\sigma ^{2}={\frac {2\cdot 11\cdot 9\cdot (2\cdot 11\cdot 9-20)}{20^{2}\cdot 19}}=4{,}6$ .

В этом случае контрольная величина z рассчитывается как ${\frac {13-10{,}9}{\sqrt {4{,}6}}}=0{,}98$ .

При уровне значимости 0,05 нулевая гипотеза H₀ отвергается, если |z| > 1,96. Это не наш случай.

Результат: нулевая гипотеза не отвергается. Элементы выборки, по-видимому, выбраны случайным образом.

Поскольку тест прогонов не является параметрическим тестом, то к результату следует относиться с осторожностью. Например, при уровне достоверности 90% нулевая гипотеза может быть отвергнута, однако параметрический критерий Шапиро-Уилка показывает, что значения данного числового ряда не распределены нормальным образом!

Связанные критерии[править | править код]

Критерий Вальда-Вольфовица, первоначально предложенный для использования с двумя выборками (последовательностями) ^[3]^[4], впоследствии был расширен для использования с несколькими выборками.^[5]^[6]^[7]^[8]

Примечания[править | править код]

↑ N — это количество элементов, а не количество прогонов.
↑ N₊ — это количество элементов с положительными значениями, а не количество положительных прогонов.
↑ N_- — это количество элементов с отрицательными значениями, а не количество отрицательных прогонов.

Ссылки[править | править код]

↑ Runs Test for Detecting Non-randomness (неопр.). Дата обращения: 9 января 2023. Архивировано 26 ноября 2022 года.
↑ Sample 33092: Wald–Wolfowitz (or runs) test for randomness (неопр.). Дата обращения: 9 января 2023. Архивировано 9 января 2023 года.
↑ Wald, Abraham; Wolfowitz, Jacob (Jun., 1940). "On a Test Whether Two Samples are from the Same Population". The Annals of Mathematical Statistics. 11 (2): 147—162. doi:10.1214/aoms/1177731909. JSTOR 2235872. {{cite journal}}: Проверьте значение даты: |date= (справка)
↑ Wald, Abraham; Wolfowitz, Jacob (Dec., 1943). "An exact test for randomness in the non-parametric case based on serial correlation". The Annals of Mathematical Statistics. 14 (4): 378—388. doi:10.1214/aoms/1177731358. JSTOR 2235925. {{cite journal}}: Проверьте значение даты: |date= (справка)
↑ Barton, DE; David, FN (1957). "Multiple runs". Biometrika. 44 (1—2): 168—178. doi:10.1093/biomet/44.1-2.168.
↑ Magel, RC; Wibowo, SH (1997). "Comparing the Powers of the Wald–Wolfowitz and Kolmogorov–Smirnov Tests". Biometrical Journal. 39 (6): 665—675. doi:10.1002/bimj.4710390605.
↑ Sprent P, Smeeton NC (2007) Applied Nonparametric Statistical Methods, pp. 217–219. Boca Raton: Chapman & Hall/ CRC.
↑ Alhakim, A; Hooper, W (2008). "A non-parametric test for several independent samples". Journal of Nonparametric Statistics. 20 (3): 253—261. CiteSeerX 10.1.1.568.6110. doi:10.1080/10485250801976741.

Внешние ссылки[править | править код]

Analysis of Runs - глава из документации к статистическому пакету NCSS
Портал machinelearning.ru / Регрессионный анализ / Критерий Вальда-Вольфовица
Функция runstest_2samp из модуля Python statsmodels, реализующая тест прогонов Вальда-Вулфовица для двух последовательностей
Иллюстрированный самоучитель по SPSS / Непараметрические тесты / Тест Уалда-Вольфовица (Wald-Wolfowitz)
Kandethody M. Ramachandran, Chris P. Tsokos. Chapter 12. Nonparametric Tests / Projects for Chapter 12 / 12B. Randomness Test (Wald–Wolfowitz Test) // Mathematical statistics with applications (англ.). — Elsevier Academic Press, 2009. — P. 653. — 824 p. — ISBN 978-0-12-374848-5.
Кобзарь, А. И.. Глава 4. Проверка гипотез о значениях параметров распределений / 4.3. Критерии тренда и случайности / 4.3.9. Критерии ранговой корреляции / 4.3.9.1. Критерий Вальда-Волфовитца // Прикладная математическая статистика. Для инженеров и научных работников (рус.). — Физматлит, 2006. — С. 539. — 816 с. — ISBN 978-5-9221-0707-5.
CRAN / randtests: Testing Randomness in R / runs.test: Wald-Wolfowitz Runs Test — runs test of randomness for continuous data

[1] N — это количество элементов, а не количество прогонов.

[2] N₊ — это количество элементов с положительными значениями, а не количество положительных прогонов.

[3] N_- — это количество элементов с отрицательными значениями, а не количество отрицательных прогонов.

[4] Runs Test for Detecting Non-randomness (неопр.). Дата обращения: 9 января 2023. Архивировано 26 ноября 2022 года.

[5] Sample 33092: Wald–Wolfowitz (or runs) test for randomness (неопр.). Дата обращения: 9 января 2023. Архивировано 9 января 2023 года.

[6] Wald, Abraham; Wolfowitz, Jacob (Jun., 1940). "On a Test Whether Two Samples are from the Same Population". The Annals of Mathematical Statistics. 11 (2): 147—162. doi:10.1214/aoms/1177731909. JSTOR 2235872. {{cite journal}}: Проверьте значение даты: |date= (справка)

[7] Wald, Abraham; Wolfowitz, Jacob (Dec., 1943). "An exact test for randomness in the non-parametric case based on serial correlation". The Annals of Mathematical Statistics. 14 (4): 378—388. doi:10.1214/aoms/1177731358. JSTOR 2235925. {{cite journal}}: Проверьте значение даты: |date= (справка)

[8] Barton, DE; David, FN (1957). "Multiple runs". Biometrika. 44 (1—2): 168—178. doi:10.1093/biomet/44.1-2.168.

[9] Magel, RC; Wibowo, SH (1997). "Comparing the Powers of the Wald–Wolfowitz and Kolmogorov–Smirnov Tests". Biometrical Journal. 39 (6): 665—675. doi:10.1002/bimj.4710390605.

[10] Sprent P, Smeeton NC (2007) Applied Nonparametric Statistical Methods, pp. 217–219. Boca Raton: Chapman & Hall/ CRC.

[11] Alhakim, A; Hooper, W (2008). "A non-parametric test for several independent samples". Journal of Nonparametric Statistics. 20 (3): 253—261. CiteSeerX 10.1.1.568.6110. doi:10.1080/10485250801976741.

[прим. 1]

[прим. 2]

[прим. 3]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Критерий Вальда — Вольфовица

Содержание

Определение[править | править код]

Применение[править | править код]

Пример проверки на случайность распределения данных[править | править код]

Связанные критерии[править | править код]

Примечания[править | править код]

Ссылки[править | править код]

Внешние ссылки[править | править код]

Навигация

Критерий Вальда — Вольфовица

Определение[править | править код]

Применение[править | править код]

Пример проверки на случайность распределения данных[править | править код]

Связанные критерии[править | править код]

Примечания[править | править код]

Ссылки[править | править код]

Внешние ссылки[править | править код]

Навигация

Поиск