Обсуждение:U-критерий Манна — Уитни

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

таблицы критических значений[править код]

В статье имеется 2 ссылки на таблицы критических значений. Первая из них мертва, вторая содержит только критические значения 5% уровня. Жаль.

Однако у меня есть некоторые сомнения. В статье есть ссылка на книгу Сидоренко, и формула приводится та же, что и в этой книге, в которой есть и таблица критических значений, отличающаяся от той, что доступна по второй ссылке. Вот это-то и настораживает. Дело том, что большинство статистических пакетов при проверке гипотез использует не истинные распределения, зависящие, как правило, от длины выборки, а асимптотические, справедливые лишь в пределе, при очень больших выборках. Это относится, в частности, и к STADIA. Таблица, на которую дана ссылка в статье, очень похожа на асимптотическую, полученную по нормальному распределению и неверна при малых объёмах выборок. Предлагаю вместо неё разместить таблицу, приведённую в книге Сидоренко, которую она, в свою очередь, почерпнула у "Гублер и Генкин" (видимо, из книги "Гублер Е.В., Генкин А.А. Применение непараметрических критериев статистики в медико-биологических исследованиях. Л.: Медицина, 1973. 142с." Могу выложить эту таблицу, вот только - куда?


89.107.193.2 17:15, 10 января 2009 (UTC)[ответить]

Жаль, что в статье не приведены теоретическое среднее и дисперсия критерия и асимптотика его распределения в случае справедливости нуль-гипотезы. Впрочем, я их привёл. 89.107.193.2 11:47, 11 января 2009 (UTC) Nickgoblin 17:54, 13 января 2009 (UTC) Nickgoblin 20:13, 23 января 2009 (UTC)[ответить]

Сообщение об ошибке[править код]

В формуле расчета параметра U фигурирует "большая сумма рангов". Пусть n1 = 3, n2 = 20. При любых значениях членов первого и второго ряда сумма рангов для второго будет больше, чем для первого. В результате если значения каждого члена первого ряда больше максимального значения для члена второго на сколь угодно большое число, при указанном в тексте методе вычисления U получим значение, больше критического (точнее - больше математического ожидания при равенстве средних). Полагаю, следует заменить выбор "максимальной" суммы выбором суммы, для которой больше средний ранг. Прямые расчеты для случаев, когда применимо асимптотическое приближение, показывают, что так получаются разумные результаты.

Автор сообщения: Смирнов М.Б. 2A00:1370:8004:C5E2:208D:5055:55D2:B13F 23:49, 17 февраля 2013 (UTC)[ответить]

К обсуждению. Sealle 19:38, 25 февраля 2013 (UTC)[ответить]

Ограничения на размер выборок[править код]

У Сидорова (стр.50) речь идёт о трудоёмкости ручного применения критерия. Сейчас никто подобным не занимается, есть куча библиотек, которые реализуют как поправки, связанные с наличием дубликатов, так и всю работу, которая раньше была ручной, и сразу выдают p-value. Сейчас считать это ограничением не следует, имхо.·Carn 16:21, 16 августа 2022 (UTC)[ответить]