Тест Чоу

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Тест Чоу на структурное изменение (Chow's breakpoint test)[править | править вики-текст]

Пусть дана выборка S объемом n, которая разбита на две подвыборки S_1,~ S_2, с объемами n_1, ~n_2 соответственно: n=n_1+n_2. Для временных рядов это означает обычно, что определен момент времени , подозреваемый на "структурный сдвиг", соответственно временные ряды разбиваются на ряды до этого момента и после.

Пусть рассматривается регрессионная модель y_t=x^T_tb+\varepsilon_t, где b-параметры модели (их количество обозначим k). Предполагается, что подвыборки могут быть неоднородными. Таким образом, для двух подвыборок имеем две модели:


\begin{cases}
y_t=x^T_tb_1+\varepsilon_t~,~t \in S_1\\
y_t=x^T_tb_2+\varepsilon_t~,~t \in S_2
\end{cases}

Эти две модели можно представить одной моделью, если использовать индикатор подвыборки d.

d_t=
\begin{cases}
1~,~t \in S_1\\
0~,~t \in S_2
\end{cases}

Используя эту переменную мы можем записать следующую модель

y_t=x^T_t(d_t b_1+(1-d_t) b_2)+\varepsilon_t=d_t x^T_t b_1+(1-d_t) x^T_t b_2+\varepsilon_t=z_1^Tb_1+z_2^Tb_2+\varepsilon_t

Таким образом, имеем одну модель для всей выборки с количеством параметров 2k. Это "длинная модель" - модель без ограничений. Если в этой модели наложить ограничение H_0:~b_1=b_2, то получим, очевидно исходную модель y_t=x^T_tb+\varepsilon_t c k параметрами также для всей выборки. Это "короткая модель" - модель с линейными ограничениями на параметры длинной модели.

Тогда процедуру теста можно свести к проверке этого линейного ограничения. При нормально распределенных случайных ошибках применяется стандартный F-тест для проверки k линейных ограничений. Статистика этого теста строится по известному принципу:

F=\frac {(ESS_S-ESS_L)/k}{ESS_L/(n-k_L)}=\frac {(ESS-ESS_1-ESS_2)/k}{(ESS_1+ESS_2)/(n-2k)}~ \sim ~ F(k,n-2k)

Соответственно, если значение этой статистики больше критического при данном уровне значимости, то гипотеза об ограничениях отвергается в пользу длинной модели, то есть выборки признаются неоднородными и необходимо строить две разные модели для выборок. В противном случае выборка однородна (параметры модели стабильны) и можно строить общую модель для выборки.

Кроме F-теста можно применять и другие тесты для проверки гипотезы об ограничениях, в частности LR-тест. Особенно это касается более общего случая, когда выделяются не две подвыборки, а несколько. Если подвыборок m, то соответствующая LR-статистика будет иметь распределение \chi^2((m-1)k)

Замечание[править | править вики-текст]

В тесте предполагается, что разными в выборках могут быть только параметры линейной модели, но не параметры распределения случайной ошибки. В частности, предполагается одинаковая дисперсия случайной ошибки в обоих подвыборках. В общем случае, однако, это может быть не так. В этом случае применяют тест Вальда со статистикой:

W=(\hat{b}_1-\hat{b}_2)^T(\hat{V}_1+\hat{V}_2)^{-1}(\hat{b}_1-\hat{b}_2) \xrightarrow {d} \chi^2(k)

где \hat{b}_1,\hat{V}_1, \hat{b}_2, \hat{V}_2 - оценки параметров и оценки их ковариационной матрицы в первой и второй подвыборках соответственно.

Тест Чоу на предсказание (Chow's forecast test)[править | править вики-текст]

Здесь применяется несколько иной подход. Строится модель для одной из подвыборок и на основе построенной модели прогнозируется зависимая переменная для второй подвыборки. Чем больше различия между предсказанными и фактическими значениями объясняемой переменной во второй выборке, тем больше разница между подвыборками. Соответстувующая F-статистика равна

F=\frac {(ESS-ESS_1)/n_2} {ESS_1/(n_1-k)} ~ \sim ~ F(n_2, n_1-k)

В данном случае также можно использовать LR-статистику с асимптотическим распределением \chi^2(n_2).

См. также[править | править вики-текст]

Литература[править | править вики-текст]