Ошибка базового процента

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск

Ошибка базового процента (другие названия: заблуждение базового процента или игнорирование базового уровня) — это ошибка в мышлении, когда сталкиваясь с общей информацией о частоте некоторого события (базовый процент) и специфической информацией об этом событии, человек имеет склонность игнорировать первое и фокусироваться на втором. [1]

Примеры[править | править код]

Пример 1[править | править код]

Джон носит готическую одежду, имеет длинные черные волосы, и слушает дэт-метал. Какова вероятность, что он христианин, и какова вероятность что он сатанист?

Если людям задать этот вопрос, они скорее всего недооценит вероятность того, что он христианин, и переоценят вероятность того, что он сатанист. Это произойдёт потому, что они проигнорируют, что базовый процент христианства (в мире исповедуют около 2 млрд. людей) значительно больше базового процента сатанизма (оценивается в несколько тысяч).

Пример 2[править | править код]

Полицейские имеют алкотестеры, которые в 5% случаев показывают ошибочное опьянение в ситуации, когда водитель трезв. Однако действительно пьяного человека они всегда определяют правильно. Один из 1000 водителей за рулем пьяный. Предположим, что полицейский случайным образом останавливает машину и предлагает водителю пройти тест. Тест показывает, что водитель пьян. Также, будем считать, что более ничего о водителе не известно (в частности в отношении других признаков опьянения). Какова вероятность, что водитель действительно пьян?

Большинство ответит, что примерно 95%, однако правильная вероятность лишь около 2%.

Для получения правильного ответа следует использовать теорему Байеса. Цель — определить вероятность того, что водитель пьян, если на это указала индикаторная трубка, которую можно выразить следующим образом:

где «D» означает, что индикаторная трубка показала, что водитель пьян, а «d» — что водитель действительно пьян. Теорема Байеса говорит, что

В первом параграфе мы получили следующие вводные данные:

где «s» - водитель на самом деле трезв.

Для вычисления по формуле теоремы Байеса требуется вероятность , которую можно получить из предыдущих значений

в результате

Подставив эти цифры в теорему Байеса, получим

Более интуитивное объяснение:

в среднем на каждые 1000 протестированных водителей,

  • 1 водитель является пьяным, и с вероятностью 100% алкотестер покажет ему верный положительный результат теста, и это 1 верный положительный результат теста;
  • 999 водителей не пьяны, и среди них 5% получат ложный положительный результат теста, что в даёт 49,95 ложных положительных результатов теста.

Общее количество положительных результатов будет равно 1 + 49,95 = 50,95. А значит вероятность верного положительного результата будет равна

.

Корректность результата, однако, зависит от верности предположения, что полицейский остановил действительно случайного водителя, а не того, что плохо вёл автомобиль. Если же остановка водителя произошла по этой или другой не произвольной причине, подсчет вероятности должен учитывать вероятность того, что пьяный водитель едет компетентно (без нарушений) и трезвый водитель едет компетентно.

Пример 3[править | править код]

В городе с миллионным населением, 100 террористов и 999900 мирных жителей. Для упрощения примера, предполагается, что все люди в городе есть его население.
Пытаясь схватить террористов, город устанавливает систему тревоги с камерами наблюдения и программным обеспечением автоматического распознавания лиц.
Программное обеспечение имеет две возможные ошибки с вероятностью 1% каждый:
  • Отрицательная ошибка: Когда камера видит террориста, сигнал тревоги прозвучит в 99% случаев, и промолчит в 1% случаев.
  • Положительная ошибка: Когда камера видит мирного жителя, сигнал тревоги промолчит в 99% случаев, и прозвучит в 1% случаев .

Теперь представьте, что сигнал тревоги прозвучал по случайного жителя. Какие шансы, что он - террорист?

Те, кто подвергаются заблуждению базового процента, скажут, что 99%. Хотя такое предположение кажется правильным, на самом деле это около 1%.

Заблуждение возникает вследствие смешения природы двух разных процентов ошибки. Количество случаев отсутствия звонка на 100 террористов и количество мирных жителей на 100 звонков является несвязанными количествами. Одно необязательно равно другому, и они даже не должно быть почти равно. Для иллюстрации этого, подумайте, что случится, если аналогичная система будет установлена ​​в другом городе, где террористов нет вовсе. Как и в первом городе, тревога сработает один раз на каждые 100 жителей города, которые не являются террористами, однако тревога никогда не сработает для террориста. Таким образом, в 100% случаев тревога звучит для не-террориста, а отрицательной ошибки просто не существует.

Представьте, что все население города в 1 млн пройдет перед камерой. На около 99 из 100 террористов сработает тревога, но так же она сработает для примерно 9999 из 999900 мирных жителей. В сумме тревога прозвучит для около 10098 человек, из которых лишь ~99 будут террористами. Таким образом, вероятность, что человек, для которого сработала тревога, является террористом 99 раз из 10098, что меньше 1%, и намного ниже изначальной догадки в 99%.

В этом случае заблуждение базового процента такое сильное потому, что мирных жителей гораздо больше, чем террористов.

См. также[править | править код]

Примечания[править | править код]

  1. The Base Rate Fallacy. www.fallacyfiles.org. Проверено 9 декабря 2015.