Ошибка базовой ставки - Base rate fallacy

В ошибка базовой ставки, также называемый пренебрежение базовой ставкой или же систематическая ошибка базовой ставки, это заблуждение. Если представлены связанные базовая ставка информации (т. е. общей информации о распространенности) и конкретной информации (т. е. информации, относящейся только к конкретному случаю), люди склонны игнорировать базовую ставку в пользу индивидуальной информации, вместо того, чтобы правильно их объединять.[1]

Пренебрежение базовой ставкой - это особая форма более общего пренебрежение расширением.

Ложноположительный парадокс

Примером ошибки базовой ставки является ложноположительный парадокс. Этот парадокс описывает ситуации, когда есть больше ложный положительный результат результаты тестов, чем истинно положительные. Например, 50 из 1000 человек дали положительный результат на инфекцию, но только у 10 была инфекция, то есть 40 тестов были ложноположительными. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборки.[2] Когда распространенность, доля тех, у кого есть данное заболевание, ниже, чем в тесте. ложный положительный результат рейтинг, даже тесты, которые имеют очень низкий шанс дать ложноположительный результат в индивидуальном случае даст больше ложных, чем истинных срабатываний общий.[3] Парадокс удивляет большинство людей.[4]

Это особенно противоречит интуиции при интерпретации положительного результата теста на низкую распространенность численность населения после получения положительных результатов, полученных в популяции с высокой распространенностью.[3] Если ложный положительный результат скорость теста выше, чем доля новый популяция с этим заболеванием, то администратор тестирования, чей опыт был взят из тестирования в популяции с высокой распространенностью, может сделать вывод из опыта что положительный результат теста обычно указывает на положительный результат, тогда как на самом деле ложноположительный результат гораздо более вероятен.

Примеры

Пример 1: болезнь

Население с высокой заболеваемостью

Число
людей
ЗараженныйНезараженныйОбщий
Тест
положительный
400
(истинно положительный)
30
(ложный положительный результат)
430
Тест
отрицательный
0
(ложноотрицательный)
570
(истинно отрицательный)
570
Общий4006001000

Представьте, что вы проводите тест на инфекционные заболевания среди населения. А 1000 человек, из которых 40% инфицированы. Уровень ложноположительных результатов теста составляет 5% (0,05), а количество ложноотрицательных результатов отсутствует. В ожидаемый результат из 1000 тестов на популяции А было бы:

Заражены и тест указывает на болезнь (истинно положительный )
1000 × 40/100 = 400 человек получат истинный позитив
Неинфицирован, и тест указывает на болезнь (ложноположительный)
1000 × 100 – 40/100 × 0,05 = 30 человек получат ложное срабатывание
Остальные 570 тестов правильно отрицательны.

Итак, в популяции А, человек, получивший положительный результат теста, может быть уверен более 93% (400/30 + 400), что это правильно указывает на инфекцию.

Население с низкой заболеваемостью

Число
людей
ЗараженныйНезараженныйОбщий
Тест
положительный
20
(истинно положительный)
49
(ложный положительный результат)
69
Тест
отрицательный
0
(ложноотрицательный)
931
(истинно отрицательный)
931
Общий209801000

Теперь рассмотрим тот же тест, применяемый к населению. B, у которых инфицировано только 2%. В ожидал результат 1000 тестов на популяции B было бы:

Заражены и тест указывает на болезнь (истинно положительный )
1000 × 2/100 = 20 человек получат настоящий позитив
Неинфицирован, и тест указывает на болезнь (ложноположительный)
1000 × 100 – 2/100 × 0,05 = 49 человек получат ложное срабатывание
Остальные 931 (= 1000 - (49 + 20)) тест положительно отрицательны.

В населении B, только 20 из 69 человек с положительным результатом теста действительно инфицированы. Таким образом, вероятность действительно заразиться после того, как человеку сказали, что он инфицирован, составляет всего 29% (20/20 + 49) для теста, который в противном случае кажется «точным на 95%».

Тестировщик с опытом работы в группе А может показаться парадоксальным, что в группе B, результат, который обычно правильно указывал на инфекцию, теперь обычно ложный положительный результат. Путаница апостериорная вероятность заражения априорная вероятность получения ложного срабатывания - естественное ошибка после получения опасного для здоровья результата теста.

Пример 2: Пьяные водители

Группа сотрудников полиции алкотестеры проявление ложного опьянения в 5% случаев, когда водитель трезв. Однако алкотестеры всегда обнаруживают по-настоящему пьяного человека. Один из тысячи водителей водит машину в нетрезвом виде. Предположим, полицейские наугад останавливают водителя, чтобы провести тест алкотестера. Это указывает на то, что водитель пьян. Мы предполагаем, что вы ничего о них не знаете. Насколько высока вероятность, что они действительно пьяны?

Многие ответят до 95%, но правильная вероятность составляет около 2%.

Объяснение этому следующее: в среднем на каждую 1000 протестированных водителей

  • 1 водитель в нетрезвом виде, и 100% уверенность в том, что для этого водителя существует истинный положительный результат теста, значит есть 1 истинный положительный результат теста
  • 999 водителей не пьяны, из них 5%. ложный положительные результаты тестирования, итого 49,95 ложный положительные результаты теста

Следовательно, вероятность того, что один из водителей среди положительных результатов теста 1 + 49,95 = 50,95 действительно пьян, составляет .

Однако достоверность этого результата зависит от правильности первоначального предположения, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если присутствовала та или иная непроизвольная причина остановки водителя, то в расчет также включается вероятность того, что водитель в состоянии алкогольного опьянения будет управлять автомобилем грамотно, а водитель в нетрезвом виде водит (не) компетентно.

Более формально такую ​​же вероятность примерно 0,02 можно установить, используя Теорема Байеса. Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестер показал, что он пьян, что может быть представлено как

куда D означает, что алкотестер показывает, что водитель пьян. Теорема Байеса говорит нам, что

В первом абзаце нам сказали следующее:

и

Как видно из формулы, нужно п(D) для теоремы Байеса, которую можно вычислить из предыдущих значений, используя закон полной вероятности:

который дает

Подставляя эти числа в теорему Байеса, мы обнаруживаем, что

Пример 3: идентификация террориста

В 1-миллионном городе пусть будет 100 террористов и 999 900 нетеррористов. Для упрощения примера предполагается, что все люди, присутствующие в городе, являются его жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, равна 0,0001, а базовая вероятность того, что этот же житель не является террористом, равна 0,9999. В попытке поймать террористов в городе устанавливают сигнализацию с камерой наблюдения и автоматикой. программное обеспечение для распознавания лиц.

Программное обеспечение имеет два уровня отказов по 1%:

  • Уровень ложных отрицательных результатов: если камера сканирует террориста, звонок будет звонить в 99% случаев, а в 1% случаев он не будет звонить.
  • Уровень ложных срабатываний: если камера сканирует человека, не являющегося террористом, звонок не будет звонить в 99% случаев, но он будет звонить в 1% случаев.

Предположим теперь, что житель вызывает тревогу. Какова вероятность того, что это террорист? Другими словами, что такое P (T | B), вероятность того, что террорист был обнаружен при звонке в колокол? Кто-то, делающий «ошибку базовой ставки», сделает вывод, что существует 99% -ная вероятность того, что обнаруженный человек является террористом. Хотя такой вывод кажется разумным, на самом деле это неверное рассуждение, и приведенный ниже расчет покажет, что вероятность того, что они террористы, на самом деле составляет около 1%, а не около 99%.

Заблуждение возникает из-за смешения природы двух разных коэффициентов отказов. «Количество не-колоколов на 100 террористов» и «количество нетеррористов на 100 колоколов» не связаны между собой. Один не обязательно равен другому, и они даже не обязательно должны быть почти равными. Чтобы продемонстрировать это, представьте, что произойдет, если во втором городе, где террористов вообще нет, была бы установлена ​​идентичная система сигнализации. Как и в первом городе, сигнал тревоги звучит для 1 из каждых 100 обнаруженных жителей, не являющихся террористами, но, в отличие от первого города, сигнал тревоги никогда не звучит для террористов. Таким образом, 100% всех случаев срабатывания сигнала тревоги относятся к нетеррористам, но ложноотрицательный показатель даже не может быть подсчитан. «Число нетеррористов на 100 колоколов» в этом городе равно 100, но P (T | B) = 0%. При звонке в колокол вероятность того, что террорист был обнаружен, равна нулю.

Представьте себе, что перед камерой проходит весь миллион жителей первого города. Около 99 из 100 террористов вызовут тревогу, равно как и около 9 999 из 999 900 нетеррористов. Таким образом, тревогу сработают около 10 098 человек, среди которых около 99 - террористы. Таким образом, вероятность того, что человек, вызвавший тревогу, на самом деле является террористом, составляет всего около 99 из 10 098, что меньше 1% и очень, очень сильно ниже нашего первоначального предположения в 99%.

Ошибка базовой ставки в этом примере вводит в заблуждение, потому что нетеррористов намного больше, чем террористов, а количество ложных срабатываний (нетеррористов, считающихся террористами) намного больше, чем истинных срабатываний (реальное количество террористов) .

Находки в психологии

В ходе экспериментов было обнаружено, что люди предпочитают индивидуальную информацию общей информации, когда первая доступна.[5][6][7]

В некоторых экспериментах студентов просили оценить средний балл (GPA) гипотетических студентов. Получая соответствующую статистику о распределении среднего балла, учащиеся, как правило, игнорировали ее, если давали описательную информацию о конкретном учащемся, даже если новая описательная информация явно не имела отношения к успеваемости в школе.[6] Этот вывод был использован, чтобы доказать, что интервью - ненужная часть поступление в колледж процесс, потому что интервьюеры не могут выбрать успешных кандидатов лучше, чем базовая статистика.

Психологи Даниэль Канеман и Амос Тверски попытался объяснить этот вывод с точки зрения простое правило или "эвристика" называется представительность. Они утверждали, что многие суждения, касающиеся вероятности или причинно-следственных связей, основаны на том, насколько одна вещь репрезентативна для другой или категории.[6] Канеман считает пренебрежение базовой ставкой особой формой пренебрежение расширением.[8] Ричард Нисбетт утверждал, что некоторые атрибуционные предубеждения словно Основная ошибка атрибуции являются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую ставку») о том, как другие вели себя в аналогичных ситуациях, и вместо этого предпочитают более простые диспозиционная атрибуция.[9]

В психологии ведутся серьезные споры об условиях, при которых люди ценят или не ценят базовую информацию.[10][11] Исследователи программы эвристики и систематических ошибок подчеркнули эмпирические результаты, показывающие, что люди склонны игнорировать базовые ставки и делать выводы, нарушающие определенные нормы вероятностного рассуждения, такие как Теорема Байеса. Вывод, сделанный на основании этого направления исследований, заключался в том, что вероятностное мышление человека в корне ошибочно и подвержено ошибкам.[12] Другие исследователи подчеркивали связь между когнитивными процессами и информационными форматами, утверждая, что такие выводы обычно необоснованны.[13][14]

Снова рассмотрим пример 2 сверху. Требуемый вывод заключается в оценке (апостериорной) вероятности того, что (случайно выбранный) водитель пьян, при условии, что тест алкотестера положительный. Формально эту вероятность можно рассчитать с помощью Теорема Байеса, как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант задачи:

1 из 1000 водителей водит машину в нетрезвом виде. Алкотестеры никогда не перестают определять по-настоящему пьяного человека. Для 50 из 999 водителей, не находящихся в состоянии алкогольного опьянения, алкотестер ложно показывает состояние опьянения. Предположим, полицейские наугад останавливают водителя и заставляют его пройти тест алкотестером. Это указывает на то, что они пьяны. Мы предполагаем, что вы ничего о них не знаете. Насколько высока вероятность, что они действительно пьяны?

В этом случае соответствующая числовая информация -п(пьяный), п(D | пьяный), п(D | трезвый) - представлен в терминах собственных частот по отношению к определенному эталонному классу (см. проблема эталонного класса ). Эмпирические исследования показывают, что выводы людей в большей степени соответствуют правилу Байеса, когда информация представлена ​​таким образом, что помогает преодолеть пренебрежение базовой оценкой среди непрофессионалов.[14] и эксперты.[15] Как следствие, организации, подобные Кокрановское сотрудничество рекомендуют использовать такой формат для передачи статистики здоровья.[16] Учить людей переводить подобные байесовские задачи мышления в форматы собственных частот более эффективно, чем просто учить их подставлять вероятности (или проценты) в теорему Байеса.[17] Также было показано, что графические представления собственных частот (например, массивы значков) помогают людям делать более точные выводы.[17][18][19]

Чем полезны форматы собственных частот? Одна из важных причин заключается в том, что этот формат информации облегчает требуемый вывод, поскольку упрощает необходимые вычисления. Это можно увидеть при использовании альтернативного способа вычисления требуемой вероятности п(пьяный |D):

куда N(пьяный ∩ D) обозначает количество пьяных водителей, получивших положительный результат алкотестера, и N(D) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения предыдущему следует из аксиом теории вероятностей, согласно которой N(пьяный ∩ D) = N × п (D | пьяный) × п (пьяный). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, психологически оно не эквивалентно. Использование собственных частот упрощает вывод, поскольку требуемая математическая операция может выполняться с натуральными числами, а не с нормализованными дробями (т. Е. Вероятностями), поскольку это делает большое количество ложных срабатываний более прозрачным, и поскольку собственные частоты демонстрируют «вложенный набор» структура".[20][21]

Не каждый частотный формат облегчает байесовские рассуждения.[21][22] Собственные частоты относятся к частотной информации, которая получается из естественная выборка,[23] который сохраняет информацию о базовой ставке (например, количество пьяных водителей при случайной выборке водителей). Это отличается от систематический отбор проб, в котором базовые ставки фиксированы априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность п (пьяный | положительный тест) из сравнения количества пьяных водителей с положительным результатом теста по сравнению с общим количеством людей, получивших положительный результат алкотестера, потому что информация о базовой скорости не сохраняется и должна быть явно повторно введена с использованием теоремы Байеса .

Смотрите также

Рекомендации

  1. ^ «Логическая ошибка: ошибка базовой ставки». Fallacyfiles.org. Получено 2013-06-15.
  2. ^ Rheinfurth, M. H .; Хауэлл, Л. У. (март 1998 г.). Вероятность и статистика в аэрокосмической технике (PDF). НАСА. п. 16. СООБЩЕНИЕ: ложноположительные тесты более вероятны, чем истинно положительные тесты, когда общая популяция имеет низкую распространенность болезни. Это называется ложноположительным парадоксом.
  3. ^ а б Вашер, Х. Л. (май 2003 г.). «Количественная грамотность - тестирование на наркотики, скрининг рака и идентификация вулканических пород». Журнал геолого-геофизического образования: 2. На первый взгляд это кажется извращенным: чем меньше учащиеся в целом используют стероиды, тем больше вероятность, что учащийся, идентифицированный как пользователь, не будет пользователем. Это было названо ложноположительным парадоксом. - Цитирование: Gonick, L .; Смит, В. (1993). Мультяшный гид по статистике. Нью-Йорк: Харпер Коллинз. п. 49.
  4. ^ Мэдисон, Б. Л. (август 2007 г.). «Математические знания для гражданства». В Schoenfeld, A.H. (ред.). Оценка математических навыков. Публикации Института математических наук (Новое изд.). Издательство Кембриджского университета. п. 122. ISBN  978-0-521-69766-8. Правильная [оценка вероятности ...] многих удивляет; следовательно, термин парадокс.
  5. ^ Бар-Гилель, Майя (1980). «Ошибка базовой ставки в вероятностных суждениях» (PDF). Acta Psychologica. 44 (3): 211–233. Дои:10.1016/0001-6918(80)90046-3.
  6. ^ а б c Канеман, Даниэль; Амос Тверски (1973). «О психологии предсказания». Психологический обзор. 80 (4): 237–251. Дои:10,1037 / ч0034747. S2CID  17786757.
  7. ^ Канеман, Даниэль; Амос Тверски (1985). «Доказательное влияние базовых ставок». В книге Даниэля Канемана, Пола Словича и Амоса Тверски (ред.). Суждение в условиях неопределенности: эвристика и предубеждения. Наука. 185. С. 153–160. Дои:10.1126 / science.185.4157.1124. PMID  17835457. S2CID  143452957.
  8. ^ Канеман, Даниэль (2000). «Оценка моментами, прошлым и будущим». У Даниэля Канемана и Амоса Тверски (ред.). Выбор, ценности и рамки.
  9. ^ Нисбетт, Ричард Э .; Э. Боргида; Р. Крэндалл; Х. Рид (1976). «Популярная индукция: информация не всегда информативна». В J. S. Carroll & J. W. Payne (ed.). Познание и социальное поведение. 2. С. 227–236.
  10. ^ Кёлер, Дж. Дж. (2010). «Ошибка базовой ставки пересмотрена: описательные, нормативные и методологические проблемы». Поведенческие науки и науки о мозге. 19: 1–17. Дои:10.1017 / S0140525X00041157. S2CID  53343238.
  11. ^ Барби, А. К .; Сломан, С. А. (2007). «Базовое уважение: от экологической рациональности к двойственным процессам». Поведенческие науки и науки о мозге. 30 (3): 241–254, обсуждение 255–297. Дои:10.1017 / S0140525X07001653. PMID  17963533. S2CID  31741077.
  12. ^ Тверски, А .; Канеман, Д. (1974). «Суждение в условиях неопределенности: эвристика и предубеждения». Наука. 185 (4157): 1124–1131. Bibcode:1974Научный ... 185.1124Т. Дои:10.1126 / science.185.4157.1124. PMID  17835457. S2CID  143452957.
  13. ^ Космидес, Леда; Джон Туби (1996). «Являются ли люди в конце концов хорошими интуитивными статистиками? Переосмысление некоторых литературных выводов о суждениях в условиях неопределенности». Познание. 58: 1–73. CiteSeerX  10.1.1.131.8290. Дои:10.1016/0010-0277(95)00664-8. S2CID  18631755.
  14. ^ а б Gigerenzer, G .; Хоффраге, У. (1995). «Как улучшить байесовское рассуждение без инструкции: частотные форматы». Психологический обзор. 102 (4): 684. CiteSeerX  10.1.1.128.3201. Дои:10.1037 / 0033-295X.102.4.684.
  15. ^ Hoffrage, U .; Lindsey, S .; Hertwig, R .; Гигеренцер, Г. (2000). «Медицина: передача статистической информации». Наука. 290 (5500): 2261–2262. Дои:10.1126 / science.290.5500.2261. PMID  11188724. S2CID  33050943.
  16. ^ Akl, E. A .; Oxman, A.D .; Herrin, J .; Vist, G.E .; Терренато, I .; Sperati, F .; Костинюк, Ц .; Бланк, Д .; Шюнеманн, Х. (2011). Шюнеманн, Хольгер (ред.). «Использование альтернативных статистических форматов для представления рисков и снижения рисков». Кокрановская база данных систематических обзоров (3): CD006776. Дои:10.1002 / 14651858.CD006776.pub2. ЧВК  6464912. PMID  21412897.
  17. ^ а б Sedlmeier, P .; Гигеренцер, Г. (2001). «Обучение байесовскому мышлению менее чем за два часа». Журнал экспериментальной психологии: Общие. 130 (3): 380. Дои:10.1037/0096-3445.130.3.380. HDL:11858 / 00-001M-0000-0025-9504-E.
  18. ^ Брасе, Г. Л. (2009). «Иллюстрированные представления в статистических рассуждениях». Прикладная когнитивная психология. 23 (3): 369–381. Дои:10.1002 / acp.1460. S2CID  18817707.
  19. ^ Эдвардс, А .; Elwyn, G .; Малли, А. (2002). «Объяснение рисков: превращение числовых данных в значимые картинки». BMJ. 324 (7341): 827–830. Дои:10.1136 / bmj.324.7341.827. ЧВК  1122766. PMID  11934777.
  20. ^ Girotto, V .; Гонсалес, М. (2001). «Решение вероятностно-статистических задач: вопрос структуры информации и формы вопроса». Познание. 78 (3): 247–276. Дои:10.1016 / S0010-0277 (00) 00133-5. PMID  11124351. S2CID  8588451.
  21. ^ а б Hoffrage, U .; Gigerenzer, G .; Krauss, S .; Мартиньон, Л. (2002). «Представление облегчает рассуждение: что такое собственные частоты, а чем нет». Познание. 84 (3): 343–352. Дои:10.1016 / S0010-0277 (02) 00050-1. PMID  12044739. S2CID  9595672.
  22. ^ Gigerenzer, G .; Хоффраге, У. (1999). «Преодоление трудностей в байесовских рассуждениях: ответ Льюису и Керену (1999) и Меллерсу и МакГроу (1999)». Психологический обзор. 106 (2): 425. Дои:10.1037 / 0033-295X.106.2.425. HDL:11858 / 00-001M-0000-0025-9CB4-8.
  23. ^ Клейтер, Г. Д. (1994). «Естественная выборка: рациональность без базовых ставок». Вклад в математическую психологию, психометрию и методологию. Последние исследования в области психологии. С. 375–388. Дои:10.1007/978-1-4612-4308-3_27. ISBN  978-0-387-94169-1.

внешняя ссылка