Критерий согласия Колмогорова

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Критерий согласия Колмогорова или Критерий согласия Колмогорова-Смирнова — статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели. Носит имена математиков Андрея Николаевича Колмогорова и Николая Васильевича Смирнова.

Критерий Колмогорова-Смирнова о проверке гипотезы об однородности двух эмпирических законов распределения является одним из основных и наиболее широко используемых непараметрических критериев, так как достаточно чувствителен к различиям в исследуемых выборках.

Содержание

[править] Статистика

Эмпирическая функция распределения (ЭФР) F_n\! случайной величины \xi\!, построенная по выборке X=\left(X_1,\;\ldots,\;X_n\right) (X_i\in\mathbb{X}), имеет вид:

F_n(x)=\frac{1}{n}\sum_{i=1}^n I_{X_i\leqslant x},\!

где I_{X_i\leqslant x}\! указывает, попало ли наблюдение X_i в область (-\infty,\;x]\!:

I_{X_i\leqslant x}=\begin{cases}1, & X_i\leqslant x; \\ 0, & X_i>x.\end{cases}\!

Статистика критерия для эмпирической функции распределения F_n(x)\! определяется следующим образом:

D_n=\sup_x |F_n(x)-F(x)|,\!

где \sup S\! — точная верхняя грань множества S={|F_n(x)-F(x)|}\!, F - предполагаемая модель.

[править] Критерий

Обозначим нулевую гипотезу H_0\!, как гипотезу о том, что выборка подчиняется распределению F(X)\in C^1(\mathbb{X})\!. Тогда по теореме Колмогорова для введённой статистики справедливо:

\forall t>0\colon\lim_{n\to\infty}P(\sqrt{n}D_n\leqslant t)=K(t)=\sum_{j=-\infty}^{+\infty}(-1)^j e^{-2j^2t^2}.\!

Учтём, что критерий имеет правостороннюю критическую область.

Logo arte.jpg Правило (параметрический критерий Колмогорова).
Если статистика \sqrt{n}D_n\! превышает процентную точку распределения Колмогорова K_\alpha\! заданного уровня значимости \alpha\!, то нулевая гипотеза H_0\! (о соответствии закону F(x)\!) отвергается. Иначе гипотеза принимается на уровне \alpha\!.

Если \alpha достаточно близко к 1, то K_\alpha\! можно приблизительно рассчитать по формуле:

K_\alpha\approx\sqrt{-\frac{1}{2}\ln\frac{1-\alpha}{2}}.\!

Асимптотическая мощность критерия равна 1.


Обозначим теперь за нулевую гипотезу H_0\! гипотезу о том, что две исследуемые выборки подчиняются одному распределению случайной величины \xi\colon F(X)\in C^1(\mathbb{X})\!.

Logo arte.jpg Теорема Смирнова.
Пусть F_{1,\;n}(x),\;F_{2,\;m}(x)\! — эмпирические функции распределения, построенные по независимым выборкам объёмом n и m случайной величины \xi. Тогда, если F(x)\in C^1(\mathbb{X}), то \forall t>0\colon\lim_{n,\;m\to\infty}P\left(\sqrt{\frac{nm}{n+m}}D_{n,\;m}\leqslant t\right)=K(t)=\sum_{j=-\infty}^{+\infty}(-1)^j e^{-2j^2t^2}, где D_{n,\;m}=\sup_x|F_{1,\;n}-F_{2,\;m}|.

Теорема Смирнова позволяет использовать данный критерий для проверки двух выборок на однородность.

Logo arte.jpg Правило (непараметрический критерий Колмогорова).
Если статистика \sqrt{\frac{nm}{n+m}}D_{n,\;m}\! превышает квантиль распределения Колмогорова K_{\alpha}\! для заданного уровня значимости \alpha\!, то нулевая гипотеза H_0\! (об однородности выборок) отвергается. Иначе гипотеза принимается на уровне \alpha\!.

[править] См. также

[править] Ссылки