P-значение

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

P-значение (англ. P-value) — величина, используемая при тестировании статистических гипотез. Фактически это вероятность ошибки при отклонении нулевой гипотезы (ошибки первого рода). Проверка гипотез с помощью P-значения является альтернативой классической процедуре проверки через критическое значение распределения.

Обычно P-значение равно вероятности того, что случайная величина с данным распределением (распределением тестовой статистики при нулевой гипотезе) примет значение, не меньшее, чем фактическое значение тестовой статистики.

Формальное определение и процедура тестирования[править | править вики-текст]

Пусть T(X) — статистика, используемая при тестировании некоторой нулевой гипотезы H_0. Предполагается, что если нулевая гипотеза справедлива, то распределение этой статистики известно. Обозначим функцию распределения F(t)=P(T<t). P-значение чаще всего (при проверке правосторонней альтернативы) определяется как:

P(t)=P(T>t)=1-F(t)

При проверке левосторонней альтернативы,

P_0(t)=P(T<t)=F(t)

В случае двустороннего теста p-значение равно:

P(t)=2 \min(P_0, P)

Если p(t) меньше заданного уровня значимости, то нулевая гипотеза отвергается в пользу альтернативной. В противном случае она не отвергается.

Преимуществом данного подхода является то, что видно при каком уровне значимости нулевая гипотеза будет отвергнута, а при каких принята, то есть виден уровень надежности статистических выводов, точнее вероятность ошибки при отвержении нулевой гипотезы. При любом уровне значимости больше p нулевая гипотеза отвергается, а при меньших значениях — нет.

Критика[править | править вики-текст]

Использование p-значений для проверки нулевых гипотез в работах по медицине подвергается критике со стороны многих специалистов. Отмечается, что их использование нередко приводят к ошибкам первого рода (false positive). В частности, журнал Basic and Applied Social Psychology (BASP) в 2015 году вовсе запретил публикацию статей, в которых используются p-значения. Редакторы журнала объяснили это тем, что сделать исследование, в котором получено p < 0,05 не очень сложно, и такие низкие значения p слишком часто становятся оправданием для низкопробных исследований[1].

См. также[править | править вики-текст]

Примечания[править | править вики-текст]