Ошибка базового процента

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Ошибка базового процента (другие названия: заблуждение базового процента или игнорирование базового уровня) — это ошибка в мышлении, когда сталкиваясь с общей информацией о частоте некоторого события (базовый процент) и специфической информацией об этом событии, человек имеет склонность игнорировать первое и фокусироваться на втором.[1]

Примеры[править | править код]

Пример 1[править | править код]

Джон носит готическую одежду, имеет длинные черные волосы и слушает дэт-метал. Какова вероятность, что он христианин, и какова вероятность, что он сатанист?

Если людям задать этот вопрос, они, скорее всего, недооценят вероятность того, что он христианин, и переоценят вероятность того, что он сатанист. Это произойдёт потому, что они проигнорируют, что базовый процент христианства (в мире исповедуют около 2 млрд людей) значительно больше базового процента сатанизма (оценивается в несколько тысяч).

Пример 2[править | править код]

Полицейские имеют алкотестеры, которые в 5 % случаев показывают ошибочное опьянение в ситуации, когда водитель трезв. Однако действительно пьяного человека они всегда определяют правильно. Один из 1000 водителей за рулем пьяный. Предположим, что полицейский случайным образом останавливает машину и предлагает водителю пройти тест. Тест показывает, что водитель пьян. Также, будем считать, что более ничего о водителе не известно (в частности в отношении других признаков опьянения). Какова вероятность, что водитель действительно пьян?

Большинство ответит, что примерно 95 %, однако правильная вероятность лишь около 2 %.

Для получения правильного ответа следует использовать теорему Байеса. Цель — определить вероятность того, что водитель пьян, если на это указала индикаторная трубка, которую можно выразить следующим образом:

где «D» означает, что индикаторная трубка показала, что водитель пьян, а «d» — что водитель действительно пьян. Теорема Байеса говорит, что

В первом параграфе мы получили следующие вводные данные:

где «s» — водитель на самом деле трезв.

Для вычисления по формуле теоремы Байеса требуется вероятность , которую можно получить из предыдущих значений

в результате

Подставив эти цифры в теорему Байеса, получим

Более интуитивное объяснение:

в среднем на каждые 1000 протестированных водителей,

  • 1 водитель является пьяным, и с вероятностью 100 % алкотестер покажет ему верный положительный результат теста, и это 1 верный положительный результат теста;
  • 999 водителей не пьяны, и среди них 5 % получат ложный положительный результат теста, что в даёт 49,95 ложных положительных результатов теста.

Общее количество положительных результатов будет равно 1 + 49,95 = 50,95. А значит вероятность верного положительного результата будет равна

.

Корректность результата, однако, зависит от верности предположения, что полицейский остановил действительно случайного водителя, а не того, что плохо вёл автомобиль. Если же остановка водителя произошла по этой или другой не произвольной причине, подсчет вероятности должен учитывать вероятность того, что пьяный водитель едет компетентно (без нарушений) и трезвый водитель едет компетентно.

Пример 3[править | править код]

В городе с миллионным населением, 100 террористов и 999900 мирных жителей. Для упрощения примера, предполагается, что все люди в городе есть его население.
Пытаясь схватить террористов, город устанавливает систему тревоги с камерами наблюдения и программным обеспечением автоматического распознавания лиц.
Программное обеспечение имеет две возможные ошибки с вероятностью 1 % каждый:
  • Отрицательная ошибка: Когда камера видит террориста, сигнал тревоги прозвучит в 99 % случаев, и промолчит в 1 % случаев.
  • Положительная ошибка: Когда камера видит мирного жителя, сигнал тревоги промолчит в 99 % случаев, и прозвучит в 1 % случаев .

Теперь представьте, что сигнал тревоги прозвучал на случайного жителя. Какие шансы, что он — террорист?

Те, кто подвергаются заблуждению базового процента, скажут, что 99 %. Хотя такое предположение кажется правильным, на самом деле это около 1 %.

Заблуждение возникает вследствие смешения природы двух разных процентов ошибки. Количество случаев отсутствия звонка на 100 террористов и количество мирных жителей на 100 звонков является несвязанными количествами. Одно необязательно равно другому, и они даже не должно быть почти равно. Для иллюстрации этого, подумайте, что случится, если аналогичная система будет установлена ​​в другом городе, где террористов нет вовсе. Как и в первом городе, тревога сработает один раз на каждые 100 жителей города, которые не являются террористами, однако тревога никогда не сработает для террориста. Таким образом, в 100 % случаев тревога звучит для не-террориста, а отрицательной ошибки просто не существует.

Представьте, что все население города в 1 млн пройдет перед камерой. На около 99 из 100 террористов сработает тревога, но так же она сработает для примерно 9999 из 999900 мирных жителей. В сумме тревога прозвучит для около 10098 человек, из которых лишь ~99 будут террористами. Таким образом, вероятность, что человек, для которого сработала тревога, является террористом 99 раз из 10098, что меньше 1 %, и намного ниже изначальной догадки в 99 %.

В этом случае заблуждение базового процента такое сильное потому, что мирных жителей гораздо больше, чем террористов.

См. также[править | править код]

Примечания[править | править код]

  1. The Base Rate Fallacy. www.fallacyfiles.org. Дата обращения 9 декабря 2015.