Критерий согласия Колмогорова

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Критерий согласия Колмогорова предназначен для проверки гипотезы о принадлежности выборки некоторому закону распределения, то есть проверки того, что эмпирическое распределение соответствует предполагаемой модели.

Критерий однородности Смирнова используется для проверки гипотезы о принадлежности двух независимых выборок одному закону распределения, то есть о том, что два эмпирических распределения соответствуют одному и тому же закону.

Эти критерии носят имена математиков Андрея Николаевича Колмогорова и Николая Васильевича Смирнова.

Критерий Смирнова о проверке гипотезы об однородности двух эмпирических законов распределения является одним из наиболее часто используемых непараметрических критериев.

Статистика критерия Колмогорова[править | править вики-текст]

Пусть эмпирическая функция распределения (ЭФР) F_n\! случайной величины \xi\!, построенная по выборке X=\left(X_1,\;\ldots,\;X_n\right) (X_i\in\mathbb{X}), имеет вид:

F_n(x)=\frac{1}{n}\sum_{i=1}^n I_{X_i\leqslant x},\!

где I_{X_i\leqslant x}\! указывает, попало ли наблюдение X_i в область (-\infty,\;x]\!:

I_{X_i\leqslant x}=\begin{cases}1, & X_i\leqslant x; \\ 0, & X_i>x.\end{cases}\!

Статистика критерия для эмпирической функции распределения F_n(x)\! определяется следующим образом:

D_n=\sup_x |F_n(x)-F(x)|,\!

где \sup S\! — точная верхняя грань множества S={|F_n(x)-F(x)|}\!, F - предполагаемая модель.

Распределение статистики Колмогорова[править | править вики-текст]

Обозначим нулевую гипотезу H_0\!, как гипотезу о том, что выборка подчиняется распределению F(X)\in C^1(\mathbb{X})\!. Тогда по теореме Колмогорова для введённой статистики справедливо:

\forall t>0\colon\lim_{n\to\infty}P(\sqrt{n}D_n\leqslant t)=K(t)=\sum_{j=-\infty}^{+\infty}(-1)^j e^{-2j^2t^2}.\!

Учтём, что критерий имеет правостороннюю критическую область.

Logo arte.jpg Принятие решения по критерию Колмогорова.
Если статистика \sqrt{n}D_n\! превышает процентную точку распределения Колмогорова K_\alpha\! заданного уровня значимости \alpha\!, то нулевая гипотеза H_0\! (о соответствии закону F(x)\!) отвергается. Иначе гипотеза принимается на уровне \alpha\!.

Если \alpha достаточно близко к 1, то K_\alpha\! можно приблизительно рассчитать по формуле:

K_\alpha\approx\sqrt{-\frac{1}{2}\ln\frac{1-\alpha}{2}}.\!

Асимптотическая мощность критерия равна 1.


Обозначим теперь за нулевую гипотезу H_0\! гипотезу о том, что две исследуемые выборки подчиняются одному распределению случайной величины \xi\colon F(X)\in C^1(\mathbb{X})\!.

Logo arte.jpg Теорема Смирнова.
Пусть F_{1,\;n}(x),\;F_{2,\;m}(x)\! — эмпирические функции распределения, построенные по независимым выборкам объёмом n и m случайной величины \xi. Тогда, если F(x)\in C^1(\mathbb{X}), то \forall t>0\colon\lim_{n,\;m\to\infty}P\left(\sqrt{\frac{nm}{n+m}}D_{n,\;m}\leqslant t\right)=K(t)=\sum_{j=-\infty}^{+\infty}(-1)^j e^{-2j^2t^2}, где D_{n,\;m}=\sup_x|F_{1,\;n}-F_{2,\;m}|.

Теорема Смирнова позволяет построить критерий для проверки двух выборок на однородность.

Logo arte.jpg Принятие решения по критерию Смирнова.
Если статистика \sqrt{\frac{nm}{n+m}}D_{n,\;m}\! превышает квантиль распределения Колмогорова K_{\alpha}\! для заданного уровня значимости \alpha\!, то нулевая гипотеза H_0\! (об однородности выборок) отвергается. Иначе гипотеза принимается на уровне \alpha\!.

См. также[править | править вики-текст]

Примечание 1[править | править вики-текст]

В критерии Колмогорова предпочтительней использование статистики с поправкой Большева в следующем виде \sqrt{n}D_n+1/(6\sqrt{n})\!. Распределение данной статистики уже не так сильно зависит от объема выборки. Зависимостью её распределения от объема выборки  n можно пренебречь при  n>25 .

Примечание 2[править | править вики-текст]

Классический критерий Колмогорова предназначен для проверки простых гипотез. Если проверяется гипотеза о согласии наблюдаемой выборки с законом, все параметры которого известны, то критерий Колмогорова является свободным от распределения: неважно, с каким законом проверяется согласие. Если проверяемая гипотеза справедлива, предельным распределением статистики Колмогорова является распределение Колмогорова  K(t) .

Всё меняется при проверке сложных гипотез, когда по анализируемой выборке оцениваются параметры теоретического закона, согласие с которым проверяется. При проверке сложных гипотез свобода от распределения теряется. При проверке сложных гипотез и справедливости проверяемой гипотезы распределения статистик непараметрических критериев согласия (и критерия Колмогорова) зависят от ряда факторов: от вида наблюдаемого закона, соответствующего проверяемой гипотезе; от типа оцениваемого параметра и числа оцениваемых параметров; в некоторых случаях от конкретного значения параметра (например, в случае семейств гамма- и бета-распределений); от метода оценивания параметров. Различия в предельных распределениях той же самой статистики при проверке простых и сложных гипотез настолько существенны, что пренебрегать этим ни в коем случае нельзя.

О применении критерия Колмогорова при проверке сложных гипотез[править | править вики-текст]

Ссылки[править | править вики-текст]