Складной нож (статистика)

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Складной нож (англ. jackknife) — один из методов ресэмплинга (линейное приближением статистического бутстрэпа), используемый для оценки погрешности в статистическом выводе. Способ заключается в следующем: для каждого элемента вычисляется среднее значение выборки без учёта данного элемента, а затем — среднее всех таких значений. Для выборки из N элементов оценка получается путём вычисления среднего значения остальных N-1 элементов.

Этот метод разработал Морис Кенуй (Maurice Quenouille 1949, 1956) с целью уменьшения погрешности оценки отдельного образца. Джон Тьюки в 1958 году расширил его возможности и предложил название «складной нож», потому что его действие напоминает складной нож — простой инструмент, которым можно решить множество различных проблем, пускай и менее эффективно, чем при помощи предназначенных для этого средств. Он может помочь улучшить оценку в случае когда данные распределены неравномерно.

Оценка[править | править код]

Оценочные параметры могут быть найдены как среднее значение элементов выборки без i-го элемента (назовем их ).

Дисперсионная оценка[править | править код]

Оценка дисперсии параметров может быть вычислена по формуле:

где — это оценочные параметры, а — оценка, основанная на всех элементах.

Другими словами оценка дисперсии — это среднее арифметическое квадратов разности среднего арифметического всех элементов и данного.

Оценка и коррекция смещения[править | править код]

Данный метод может быть использован для оценки погрешности параметра относительно всей выборки. Введем , как оценку параметра на основе всех данных: