Статистический критерий

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Статистический критерий — строгое математическое правило, по которому принимается или отвергается та или иная статистическая гипотеза с известным уровнем значимости. Построение критерия представляет собой выбор подходящей функции от результатов наблюдений (ряда эмпирически полученных значений признака), которая служит для выявления меры расхождения между эмпирическими значениями и гипотетическими.

Определение[править | править исходный текст]

Пусть даны выборка \mathbf{X} = (X_1,\ldots,X_n) из неизвестного совместного распределения \mathbb{P}^{\mathbf{X}}, и семейство статистических гипотез H_0,H_1,\ldots. Тогда статистическим критерием называется функция, устанавливающая соответствие между наблюдаемыми величинами и возможными гипотезами:

f: \mathbb{R}^n \to \{H_0,H_1,\ldots\}.

Таким образом каждой реализации выборки \mathbf{x} = (x_1,\ldots,x_n) статистический критерий сопоставляет наиболее подходящую с точки зрения этого критерия гипотезу о распределении, породившем данную реализацию.

Виды критериев[править | править исходный текст]

Статистические критерии подразделяются на следующие категории:

  • Критерии согласия. Проверка на согласие подразумевает проверку предположения о том, что исследуемая случайная величина подчиняется предполагаемому закону. Критерии согласия можно также воспринимать, как критерии значимости. Критериями согласия являются:
  1. Критерий Пирсона
  2. Критерий Колмогорова
  3. Критерий Андерсона-Дарлинга
  4. Критерий Крамера — Мизеса — Смирнова
  5. Критерий согласия Купера
  6. Z-тест
  7. Критерий Жака-Бера (англ.)
  8. Критерий Шапиро-Уилка (англ.)
  9. График нормальности (англ.) — не столько критерий, сколько графическая иллюстрация: точки специально построенного графика должны лежать почти на одной прямой.

Это разделение условно, и зачастую один и тот же критерий может быть использован в разных качествах.

Непараметрические критерии[править | править исходный текст]

Группа статистических критериев, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.

Параметрические критерии[править | править исходный текст]

Группа статистических критериев, которые включают в расчет параметры вероятностного распределения признака (средние и дисперсии).

Основные понятия[править | править исходный текст]

Простой пример[править | править исходный текст]

Пусть дана независимая выборка \mathbf{X} = (X_1,\ldots,X_n)^{\top}, где X_i \sim \mathrm{N}(\mu,1),\quad i=1,\ldots,n. Пусть есть две простые гипотезы:

\begin{matrix}
H_0: & \mu = 0, \\
H_1: & \mu = 1.
\end{matrix}

Тогда можно определить следующий статистический критерий:

f(x_1,\ldots,x_n) = 
\left\{
\begin{matrix}
H_0, & \bar{x} \le 0.5 \\
H_1, & \bar{x} > 0.5,
\end{matrix}
\right.

где \bar{x} = \frac{1}{n}\sum\limits_{i=1}^n x_i - выборочное среднее.

См. также[править | править исходный текст]

Литература[править | править исходный текст]

  1. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика: Правила проверки согласия опытного распределения с теоретическим. Часть II: Непараметрические критерии. — М.: Госстандарт РФ, 2002. Электронная версия.