t-критерий Стьюдента

Материал из Википедии — свободной энциклопедии

Перейти к: навигация, поиск

t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

Содержание

[править] История

Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).

[править] Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

[править] Двухвыборочный t-критерий для независимых выборок

В случае с незначительно отличающимся размером выборки применяется упрощённая формула приближенных расчётов:

 t = \frac{|M_1 - M_2|}{\sqrt{\frac{\sigma_1^2}{N_1}+\frac{\sigma_2^2}{N_2}}}

В случае, если размер выборки отличается значительно, применяется более сложная и точная формула:

 t = \frac{|M_1 - M_2|}{\sqrt{\frac{(N_1 - 1)\sigma_1^2 + (N_2 - 1)\sigma_2^2}{N_1 + N_2 - 2}(\frac{1}{N_1}+\frac{1}{N_2})}}

Где M1,M2 - средние арифметические, σ12 - стандартные отклонения, а N1,N2 - размеры выборок.

Количество степеней свободы рассчитывается как

\,df = N_1 + N_2 - 2

[править] Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

t = \frac {|M_d|}{\sigma_d / \sqrt {N}}

где Md - средняя разность значений, а σd - стандартное отклонение разностей.

Количество степеней свободы рассчитывается как

\,df = N - 1

[править] Одновыборочный t-критерий

Применяется для проверки гипотезы об отличии среднего значения \,M_x от некоторого известного значения \,A:

t = \frac{|M_x - A|}{\sigma / \sqrt{N}}

Количество степеней свободы рассчитывается как

\,df = N - 1

[править] Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна-Уитни. Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона