Леди, дегустирующая чай

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Леди, дегустирующая чай (леди, пробующая чай, англ. lady tasting tea) — рандомизированный эксперимент[англ.] по определению статистической значимости для проверки нулевой гипотезы, проведенный английским ученым Роналдом Фишером.

Эксперимент был описан в книге Фишера The Design of Experiments[англ.], на его основе был предложен точный тест Фишера.

Традиционный английский чай можно приготовить двумя способами: сначала налить в чашку молоко, а потом чай; или наоборот, сначала чай, а потом молоко. В 1946 году в эссе «Хорошая чашка чая» Джордж Оруэлл утверждал, что «чай является основой цивилизации в нашей стране, однако процесс его приготовления порождает очень много споров»[1]. Вопрос очередности наливания молока и чая настолько разделил общественное мнение, что «у каждой семьи могут найтись сторонники обеих сторон».

Знакомая Роналда Фишера, альголог Муриэль Бристоль (англ. Muriel Bristol), как-то сказала, что может отличить напитки, приготовленные разными способами. Для проверки этого утверждения Фишер организовал эксперимент, в ходе которого леди должна была определить способ приготовления восьми чашек чая (по четыре на каждый способ), представленных в случайном порядке. В ходе дегустации Бристоль смогла правильно классифицировать все чашки.

Эксперимент

[править | править код]

Нулевой гипотезой для данного эксперимента было утверждение, что все чашки имеют одинаковый вкус и способ приготовления определить невозможно.

Для эксперимента приготовили восемь чашек: в четырёх случаях сначала наливали чай, а потом молоко, в других четырёх — наоборот. Чашки подавались в случайном порядке. Леди должна была выбрать из предложенных чашек четыре, приготовленных способом «сначала молоко». При этом она имела возможность сравнивать чашки друг с другом, а также ей были известны другие условия эксперимента.

Тестовым показателем было количество успешных определений в наборе из четырёх чашек. Количество возможных вариантов выбрать 4 чашки из 8 равно числу сочетаний при и :

При условии, что нулевая гипотеза является верной, варианты распределяются так:

Количество верных определений Возможные комбинации Количество комбинаций
0 oooo 1
1 ooox, ooxo, oxoo, xooo 16
2 ooxx, oxox, oxxo, xoxo, xxoo, xoox и другие 36
3 oxxx, xoxx, xxox, xxxo 16
4 xxxx 1
Всего 70

Количества вариантов распределяются так:

  • Очевидно, существует один вариант, когда все отобранные чашки будут ложными
  • Рассмотрим случай, когда лишь одна из четырёх отобранных чашек будет угадана верно, а остальные три будут ложными. Здесь есть способа выбрать единственную верную чашку, а также способы выбрать три из четырёх неверных вариантов. Общее количество вариантов составляет 4×4 = 16

Уровень значимости установили в 5 %. Таким образом, вероятность выбора всех четырёх правильных вариантов была ниже уровня значимости (≈ 1,4 % < 5 %), а вероятность выбора с однократной ошибкой находилась выше (16 + 1) / 70 ≈ 24,3 % > 5 %.

Таким образом было показано, что нулевая гипотеза опровергалась бы тогда и только тогда, когда леди сможет правильно определить все четыре чашки для набора.

Использование точного теста Фишера

[править | править код]

Для случая, когда леди правильно определяет одну из четырёх выбранных чашек, можно построить следующую таблицу сопряженности[2]:

Сначала молоко Сначала чай Всего
Правильно угадано «сначала молоко» a=3 b=1 a+b=4
Правильно угадано «сначала чай» c=1 d=3 c+d=4
Всего a+c=4 b+d=4 n=8

Вероятность данного случая рассчитывается по формуле:

То есть

Кроме математического обоснования, Фишер также заложил основные принципы проведения подобных экспериментов[3]:

  • Сравнение — должна быть возможность четкого различения вариантов. В данном случае те, кто готовил эксперимент, точно знали, какая чашка было приготовлена каким способом.
  • Рандомизация — важнейшая особенность эксперимента заключалась в том, что чашки подавались в случайном порядке
  • Репликация — для увеличения точности эксперимента его следует повторить несколько раз (леди должна делать выбор 8 раз)
  • Заменимость — все варианты выбора (чашки) должны быть похожими друг с другом, за исключением того фактора, который их отличает.
  • Блокировка — если в эксперименте присутствуют другие факторы, исследователь должен отделить их. Например, если бы тут было два сорта чая, правильнее было бы сделать серию выборов для каждого сорта отдельно.

Примечания

[править | править код]
  1. George Orwell, Ian Angus, Sheila Davison (1998). The Complete Works of George Orwell: Smothered under journalism, 1946. p. 34. Secker & Warburg
  2. The lady tasting tea experiment. Дата обращения: 1 февраля 2021. Архивировано 5 февраля 2021 года.
  3. What Does a Lady Tasting Tea Have to Do with Science? Дата обращения: 1 февраля 2021. Архивировано 15 января 2021 года.