Обсуждение:Статистическая значимость

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

This is a nice description of the statistical concept. In effect, this is a Russian translation of the corresponding English version. I would suggest expanding the article. Perhaps, I will do it later myself.

Great job!


=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-

There is an interesting statistical problem: Out of 204 files, 14 files are corrupt:

008 god's omnipresence (psalm 23).mp3 010 how can i know that i am saved_.mp3 017 sermon - evening - august 5, 2007.mp3. 018 sermon - evening - december 2, 2007.mp3. 024 sermon - evening - july 8, 2007.mp3 026 sermon - evening - june 17, 2007.mp3 027 sermon - evening - june 24, 2007.mp3 030 sermon - evening - november 25, 2007.mp3.zip 073 sermon1128266861.mp3 110 sermon1133725693.mp3 122 sermon1136776410.mp3 134 sermon1141017165.mp3 135 sermon1141017655.mp3 189 sermonmorningdec232007.mp3

What is the p value of the confidence interval (0.01, 0.02) for the proportion of the corrupted files? 144.85.185.201 01:32, 15 февраля 2009 (UTC)[ответить]

Когда я создавал эту статью 14 января 2008‎ (195.131.228.217), то дал определение в форме: "В статистике, величину называют статисти́чески зна́чимой, если мала вероятность чисто случайного возникновения её или еще более крайних величин. Здесь под крайностью понимается степень отклонения от нуль-гипотезы. ". Участник Zolumov (к сожалению теперь он заблокирован) заметил (20 мая 2011‎) что "только сбивает" и убрал оговорку "или еще более крайних величин".

Почему нельзя убрать оговорку "или еще более крайних величин"?

А вот почему. Во-первых, потому что вероятность появления любого отдельно взятого значения непрерывно распределённой величины по определению равна нулю. Так что если убрать "или ещё более крайних", то тогда такое определение сразу уже теряет какой-либо смысл для непрерывного случая. И хотя может ошибочно показаться что какой-то смысл остался бы, его там нет (попробуйте воспользоваться таким вариантом!).

Во-вторых, даже если речь идет о дискретном респределённии, определение статистической значимости имеет смысл только в контексте уже заданных нуль-гипотезы и альтернативной гипотезы, то есть двух семейств распределений, значит и в контексте определённых критических областей. Така как нас интересуют прежде всего наиболее мощные тесты, то критические области определяются с помощью леммы Неймана пирсона (англ.)), и, следовательно, для практически важных распределений имеют форму крайних областей, в противоположность 'центральной' области где нуль-гипотеза не отвергается. Какая именно область является критической, а какая нет - определяется с помощью тестовой статистики (функции лямбда фигурирующей в лемме Неймана-Пирсона) или алгебраически эквивалентной ей функции. Об этой тестовой статистике и идет речь.

Английский вариант статьи очевидно написан любителями, давайте не будем уподобляться. Если не будет возражений, я верну начало статьи как было.

217.162.116.245 23:52, 12 февраля 2012 (UTC)[ответить]

Как вы смотрите на следующий текст для начала статьи: Статистическая значимость - степень неслучайности отклонения параметров (в широком смысле) выборочных данных от предполагаемых в нулевой гипотезе. Отклонение следует понимать в смысле соответствия альтернативной гипотезе. Часто говорят, что параметр статистически значимо отличается от предполагаемого значения. Причем, если это значение равно нулю, то говорят просто о статистической значимости параметра (в смысле значимости отличия от нуля). Статистическая значимость может быть признана только с определенной надежностью (доверительной вероятностью) или как говорят "при данном (-процентном) уровне значимости". Это означает, что с допустимой вероятностью ошибки отклонение параметров признается статистически значимым. Обычная процедура проверки гипотез предполагает наличие некоторой выборочной статистики, которая при выполнении нулевой гипотезы, имеет некоторое известное распределение, следовательно должна принимать значения из центральной области распределения статистики. где вероятность выше. Поэтому статистическая значимость обычно определяется вероятностью "хвостов" распределения, включающих фактическое значение статистики .

Что вы думаете о таком варианте. Естественно редакционные изменения возможны. Я про концепцию.MyWikiNik 13:02, 2 марта 2012 (UTC)[ответить]