Ошибка базового процента

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Ошибка базового процента (другие названия: заблуждение базового процента или игнорирование базового уровня) — это ошибка в мышлении, когда сталкиваясь с общей информацией о частоте некоторого события (базовый процент) и специфической информацией об этом событии, человек имеет склонность игнорировать первое и фокусироваться на втором.[1]

Примеры[править | править код]

Пример 1[править | править код]

Полицейские имеют алкотестеры, которые в 5 % случаев показывают ошибочное опьянение в ситуации, когда водитель трезв. Однако действительно пьяного человека они всегда определяют правильно. Один из 1000 водителей за рулем пьяный. Предположим, что полицейский случайным образом останавливает машину и предлагает водителю пройти тест. Тест показывает, что водитель пьян. Также, будем считать, что более ничего о водителе не известно (в частности, в отношении других признаков опьянения). Какова вероятность, что водитель действительно пьян?

Большинство ответит, что примерно 95 %, однако правильная вероятность лишь около 2 %.

Для получения правильного ответа следует использовать теорему Байеса. Цель — определить вероятность того, что водитель пьян, если на это указала индикаторная трубка, которую можно выразить следующим образом:

где «D» означает, что индикаторная трубка показала, что водитель пьян, «d» — что водитель действительно пьян, а «s» — что водитель на самом деле трезв. Теорема Байеса говорит, что

В первом параграфе мы получили следующие вводные данные:

где «s» — водитель на самом деле трезв.

Для вычисления по формуле теоремы Байеса требуется вероятность , которую можно получить из предыдущих значений

в результате

Подставив эти цифры в теорему Байеса, получим

Более интуитивное объяснение:

в среднем на каждые 1000 протестированных водителей,

  • 1 водитель является пьяным, и с вероятностью 100 % алкотестер покажет ему верный положительный результат теста, и это 1 верный положительный результат теста;
  • 999 водителей не пьяны, и среди них 5 % получат ложный положительный результат теста, что в среднем даёт 49,95 ложных положительных результатов теста.

Общее количество положительных результатов будет равно 1 + 49,95 = 50,95. А значит вероятность верного положительного результата будет равна

.

Корректность результата, однако, зависит от верности предположения, что полицейский остановил действительно случайного водителя, а не того, что плохо вёл автомобиль. Если же остановка водителя произошла по этой или другой не произвольной причине, подсчет вероятности должен учитывать вероятность того, что пьяный водитель едет компетентно (без нарушений) и трезвый водитель едет компетентно.

Пример 2[править | править код]

В городе с миллионным населением, 100 террористов и 999900 мирных жителей. Для упрощения примера, предполагается, что все люди в городе есть его население.

Пытаясь схватить террористов, город устанавливает систему тревоги с камерами наблюдения и программным обеспечением автоматического распознавания лиц.

Программное обеспечение имеет две возможные ошибки с вероятностью 1 % каждая:

  • Отрицательная ошибка: Когда камера видит террориста, сигнал тревоги прозвучит в 99 % случаев, и промолчит в 1 % случаев.
  • Положительная ошибка: Когда камера видит мирного жителя, сигнал тревоги промолчит в 99 % случаев, и прозвучит в 1 % случаев.

Теперь представьте, что сигнал тревоги прозвучал на случайного жителя. Какие шансы, что он — террорист?

Те, кто подвергаются заблуждению базового процента, скажут, что 99 %. Хотя такое предположение кажется правильным, на самом деле это около 1 %.

Заблуждение возникает вследствие смешения природы двух разных процентов ошибки. Количество случаев отсутствия звонка на 100 террористов и количество мирных жителей на 100 звонков является несвязанными количествами. Одно необязательно равно другому, и они даже не должны быть почти равны. Для иллюстрации этого, подумайте, что случится, если аналогичная система будет установлена ​​в другом городе, где террористов нет вовсе. Как и в первом городе, тревога сработает один раз на каждые 100 жителей города, которые не являются террористами, однако тревога никогда не сработает для террориста. Таким образом, в 100 % случаев тревога звучит для не-террориста, а отрицательной ошибки просто не существует.

Представьте, что всё население города в 1 млн пройдёт перед камерой. На около 99 из 100 террористов сработает тревога, но так же она сработает для примерно 9999 из 999900 мирных жителей. В сумме тревога прозвучит для около 10098 человек, из которых лишь ~99 будут террористами. Таким образом, вероятность, что человек, для которого сработала тревога, является террористом, — 99 раз из 10098, что меньше 1 %, и намного ниже изначальной догадки в 99 %.

В этом случае заблуждение базового процента такое сильное потому, что мирных жителей гораздо больше, чем террористов.

См. также[править | править код]

Примечания[править | править код]

  1. The Base Rate Fallacy. www.fallacyfiles.org. Дата обращения: 9 декабря 2015.