Проверка статистических гипотез

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Проверки статистических гипотез — один из классов задач в математической статистике.

Статистические гипотезы[править | править исходный текст]

Определения[править | править исходный текст]

Пусть в (статистическом) эксперименте доступна наблюдению случайная величина X, распределение которой \mathbb{P} известно полностью или частично. Тогда любое утверждение, касающееся \mathbb{P}, называется статистической гипотезой. Гипотезы различают по виду предположений, содержащихся в них:

  • Статистическая гипотеза, однозначно определяющая распределение \mathbb{P}, то есть H:\;\{\mathbb{P}= \mathbb{P}_0\}, где \mathbb{P}_0 какой-то конкретный закон, называется простой.
  • Статистическая гипотеза, утверждающая принадлежность распределения \mathbb{P} к некоторому семейству распределений, то есть вида H:\;\{\mathbb{P}\in \mathcal{P}\}, где \mathcal{P} — семейство распределений, называется сложной.

На практике обычно требуется проверить какую-то конкретную и как правило простую гипотезу H_0. Такую гипотезу принято называть нулевой. При этом параллельно рассматривается противоречащая ей гипотеза H_1, называемая конкурирующей или альтернативной.

Выдвинутая гипотеза нуждается в проверке, которая осуществляется статистическими методами, поэтому гипотезу называют статистической. Для проверки гипотезы используют критерии, позволяющие принять или опровергнуть гипотезу.

В большинстве случаев статистические критерии основаны на случайной выборке (X_1,X_2,\dots,X_n) фиксированного объема n\geq 1 из распределения \mathbb P. В последовательном анализе выборка формируется в ходе самого эксперимента и потому её объем является случайной величиной (см. Последовательный статистический критерий).

Пример[править | править исходный текст]

Пусть дана независимая выборка (X_1,\ldots,X_n) \sim \mathcal{N}(\mu, 1) из нормального распределения, где \mu — неизвестный параметр. Тогда H_0:\;\{\mu = \mu_0\}, где \mu_0 — фиксированная константа, является простой гипотезой, а конкурирующая с ней H_1:\;\{\mu > \mu_0\} — сложной.

Этапы проверки статистических гипотез[править | править исходный текст]

  1. Формулировка основной гипотезы H_0 и конкурирующей гипотезы H_1.
  2. Задание уровня значимости \alpha, на котором в дальнейшем и будет сделан вывод о справедливости гипотезы. Он равен вероятности допустить ошибку первого рода.
  3. Расчёт статистики \phi критерия такой, что:
    • её величина зависит от исходной выборки \mathbf{X}=(X_1,\ldots,X_n): \; \phi=\phi(X_1,\ldots,X_n) ;
    • по её значению можно делать выводы об истинности гипотезы H_0;
    • сама статистика \phi должна подчиняться какому-то известному закону распределения, так как сама \phi является случайной в силу случайности \mathbf{X}.
  4. Построение критической области. Из области значений \phi выделяется подмножество \mathbb{C} таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство P(\phi\in\mathbb{C})=\alpha. Это множество \mathbb{C} и называется критической областью.
  5. Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику \phi и по попаданию (или непопаданию) в критическую область \mathbb{C} выносится решение об отвержении (или принятии) выдвинутой гипотезы H_0.

Виды критической области[править | править исходный текст]

Выделяют три вида критических областей:

  • Двусторонняя критическая область определяется двумя интервалами (-\infty,\;x_{\alpha/2})\cup(x_{1-\alpha/2}\;+\infty), где x_{\alpha/2},\; x_{1-\alpha/2} находят из условий P(\phi<x_{\alpha/2})=\frac{\alpha}{2}, \quad P(\phi<x_{1-\alpha/2})=1-\frac{\alpha}{2}.
  • Левосторонняя критическая область определяется интервалом (-\infty,\; x_\alpha), где x_\alpha находят из условия P(\phi<x_\alpha)=\alpha.
  • Правосторонняя критическая область определяется интервалом (x_{1-\alpha},\;+\infty), где x_{1-\alpha} находят из условия P(\phi<x_{1-\alpha})=1-\alpha.

См. также[править | править исходный текст]


Statistic template.svg Статистические критерии:
Ниже для помощи в навигации приведён список статистических критериев.
(список далеко не полный и не все из перечисленных статей существуют на данный момент; вы можете помочь проекту, создав статью из списка или добавив новую)

F-критерий | Q-критерий Розенбаума | t-критерий Стьюдента | U-критерий Манна-Уитни | Z-критерий | Критерий Бартлетта | Критерий Колмогорова | Критерий Кохрена | Критерий отношения правдоподобия | Критерий Пирсона | Критерий Уилкоксона | Критерий Фридмана | Критерий знаков