Книги

Рациональность. Что это, почему нам ее не хватает и чем она важна

22
18
20
22
24
26
28
30

Пренебрежение базовой оценкой не всегда является симптомом эвристики репрезентативности. Иногда на нем настаивают целенаправленно. Феномен «запретной базовой оценки» входит в тройку выделенных Тетлоком светских табу наряду с запретными уступками и еретическими предположениями (глава 2)[234].

Почву под запрет базовой оценки подводит одна из социологических закономерностей. Измерьте любую социально значимую переменную — экзаменационные баллы, карьерные предпочтения, уровень социального доверия, доход, процент заключенных браков, особенности образа жизни, частоту различных типов насилия (уличная преступность, групповая преступность, домашнее насилие, организованная преступность, терроризм). Теперь разбейте результат по стандартным демографическим категориям: возраст, пол, раса, религия, национальность. Средние показатели по различным подгруппам никогда не совпадут, причем разница порой значительна. Неважно, что является ее причиной — природа, культура, дискриминация, история или какая-то их комбинация, — разница реальна, она существует.

Вряд ли такое положение дел кого-то удивит, но применить это знание можно так, что кровь стынет в жилах. Скажем, вы хотите получить максимально точный прогноз по поводу жизненных перспектив определенного человека: хорошо ли он будет учиться в колледже, каких успехов добьется в профессиональной деятельности, насколько высок в его случае риск неплатежа по кредиту, какова вероятность, что он совершит преступление, или скроется от правосудия, или нарушит закон повторно, или устроит теракт. Если вы истинный последователь Байеса, вы начнете с определения базовой оценки на основании его возраста, пола, классовой принадлежности, расы, национальности и вероисповедания, а затем станете вводить поправки с учетом личных особенностей этого человека. Другими словами, вам придется прибегнуть к профайлингу, то есть ваше мнение будет пристрастным не из-за невежества, ненависти, снобизма или какого-нибудь еще — изма или — фобии, но в результате продиктованной лучшими намерениями попытки сделать как можно более точный прогноз.

Разумеется, большинство из нас приходит в ужас даже от мысли о чем-то подобном. Тетлок просил испытуемых представить себе сотрудника страховой фирмы, которому нужно определять размер страховой премии для жителей различных районов города, учитывая, как часто в этих районах случаются пожары. С этим участники никаких проблем не имели. Но, если им говорили, что вышеупомянутые районы отличаются по расовому составу населения, они тут же передумывали и принимались осуждать того же сотрудника — по сути, просто за то, что тот хорошо делает свою работу. А если они сами играли роль этого сотрудника и узнавали ужасную правду о демографической статистике, они пытались смыть с себя позорное пятно, выражая желание принять участие в антирасистской кампании.

Может, это еще один пример человеческой нерациональности? Неужели расизм, сексизм, исламофобия, антисемитизм и прочие предубеждения «рациональны»? Конечно же, нет! Объяснение кроется в определении рациональности, данном в главе 2: рациональность — это способность использовать знание для достижения целей. Если точный страховой прогноз — наша единственная цель, то мы, вероятно, должны использовать любые крупицы информации, которые помогут как можно точнее рассчитать априорную вероятность. Но все дело в том, что это не единственная наша цель.

Есть и более высокая цель — справедливость. Нельзя формировать отношение к человеку, опираясь на его расу, гендер или национальность, нельзя судить о нем не по его личным качествам, а по цвету кожи или набору хромосом. Каждый из нас хочет к себе непредвзятого отношения, и согласно логике беспристрастности (глава 2) мы должны признавать это право и за всеми остальными.

Более того, только если общественное устройство воспринимается как справедливое — если люди знают, что получат равные возможности, что их не будут оценивать по биологическим или историческим характеристикам, над которыми они не властны, — только тогда оно завоюет доверие граждан. А иначе зачем играть по правилам, если общество все равно выбросит тебя на помойку, потому что ты не вышел цветом кожи, или полом, или вероисповеданием?

Еще одна наша цель — избежать самосбывающихся пророчеств. Если некая этническая группа или определенный пол в прошлом страдал от угнетения, в настоящем его представители могут столкнуться с препятствием в виде отличающихся средних показателей. Если эти базовые оценки подставлять в прогностические формулы, которые определяют судьбу таких людей в будущем, мы обречем их на вечное отставание. Сегодня, когда эти формулы спрятаны в недрах нейросетей глубокого обучения с их недоступными нашему пониманию промежуточными слоями (глава 3), проблема стоит еще острее. Желание общества остановить этот круговорот несправедливости, пусть и ценой точности прогнозов, вполне рационально.

И наконец, управленческие решения — это сигналы. Запрещая использование этнических, гендерных, расовых или религиозных базовых оценок, общество демонстрирует приверженность идеям равенства и справедливости, которая определяет отнюдь не только алгоритмы, допустимые при исполнении чиновниками своих обязанностей. Тем самым провозглашается, что немыслима любая предвзятость, а предвзятость, в основе которой лежат неприязнь и невежество, особенно предосудительна.

Таким образом, запрет на использование базовых оценок имеет солидное рациональное основание. Но теорема есть теорема, и если точностью прогнозов мы с охотой жертвуем ради равного отношения органов власти к отдельным гражданам, в других сферах эта жертва может оказаться неоправданной. Одна из таких сфер — страховое дело. Если страховая компания будет неверно оценивать риски для различных групп населения, выплаты по страховым случаям превысят страховые премии, и вся система обрушится. Страховая компания Liberty Mutual дискриминирует юношей, которые чаще становятся виновниками ДТП, рассчитывая им стоимость страховки по повышенной базовой оценке, потому что, если страховщики не будут этого делать, лихачество парней придется оплачивать законопослушным взрослым женщинам. Но даже здесь закон запрещает страховым компаниям использовать при расчете ставок определенные критерии, прежде всего расу и в некоторых случаях пол.

Вторая сфера, где неразумно запрещать базовые оценки, — это понимание природы общественных явлений. Если процентная доля мужчин и женщин в определенной области деятельности различается, доказывает ли это, что «стражи у ворот» не допускают в эту область женщин, или, быть может, все дело в базовой оценке числа женщин, которые пытаются в упомянутые ворота войти? Если ипотечные операторы чаще отклоняют заявки претендентов из числа меньшинств, они расисты? Или, может, они, подобно гипотетическому сотруднику страховой компании в исследовании Тетлока, учитывают базовые оценки неплатежей по кредитам в разных районах города, которые, так уж случилось, коррелируют с расовым составом населения этих районов? Усилия социологов, которые стараются найти ответы на эти вопросы, зачастую вознаграждаются лишь обвинениями в расизме и сексизме. Но, запрещая социологам и журналистам интересоваться базовыми оценками, мы только мешаем им выискивать сохраняющуюся дискриминацию и отличать ее от последствий имевших место в прошлом экономических, культурных или юридических различий между разными группами населения.

Раса, пол, национальность, религия и сексуальная ориентация превратились в зоны активных боевых действий на поле интеллектуальной жизни, и это несмотря на то, что открытая дискриминация всех сортов значительно сократилась[235]. По-моему, это во многом происходит из-за отсутствия четкого понимания базовых оценок — неумения определить, когда имеется веская причина запрещать их, а когда таких причин нет[236]. Но в том-то и беда с любым табу. Это похоже на запрет думать о белом медведе: само обсуждение табу — уже табу.

И все-таки мы — последователи Байеса

Но, несмотря на все эти табу, стереотипы и запреты, было бы ошибкой списать наш вид в утиль как безнадежно неспособный к байесовскому мышлению. (Представители племени сан, например, вполне себе последователи Байеса: прежде чем решить, что след оставлен животным редкого вида, они считают необходимым удостовериться, что аргументы в пользу этого неоспоримы.) Гигеренцер отмечает, что обычные люди, формально нарушающие правило Байеса, зачастую имеют на то серьезные математические основания[237]. Математики сами жалуются на социологов, которые нередко используют статистические формулы бездумно: подставляют числа, подбивают итог и считают, что получили верный результат. Но на самом деле любая статистическая формула хороша настолько, насколько хороши стоящие за ней предположения. Обычные люди могут чувствовать качество таких предположений, и порой, нарушая, на первый взгляд, правило Байеса, они как раз и проявляют ту самую осторожность, к которой призывают математики.

Начать с того, что априорная вероятность и базовая оценка — это не одно и то же, несмотря на то что в контрольных работах в качестве «верного» априорного предположения чаще всего предполагается использовать именно базовую оценку. Весь вопрос в том, какую базовую оценку. Допустим, я получил положительный результат анализа на простат-специфический антиген и хочу оценить апостериорную вероятность того, что у меня рак простаты. Какую базовую оценку распространенности рака простаты в популяции я должен взять в качестве априорной вероятности? Среди белых американцев? Евреев-ашкенази? Евреев-ашкенази старше 65 лет? Евреев-ашкенази старше 65 лет, которые занимаются спортом и не имеют семейной истории заболевания? Эти оценки могут сильно отличаться. Конечно, чем ýже референтная группа, тем лучше — но чем она ýже, тем меньше выборка, на которой основана оценка, и тем сильнее эта оценка искажена. Лучшая референтная группа та, которую составляют люди, в точности похожие на меня; а именно я один — максимально подходящий и максимально бесполезный образец для сравнения. Определяя подходящую априорную вероятность, мы вынуждены искать баланс между специфичностью и надежностью и не должны безоговорочно соглашаться на базовую оценку для населения в целом, которая подразумевается по умолчанию.

Использование базовой оценки в качестве априорной вероятности таит в себе и другую опасность: базовые оценки меняются, и порой быстро. Сорок лет назад девушки составляли около 10 % от числа студентов ветеринарных школ; сегодня их почти 90 %[238]. В последние несколько десятилетий, подставляя в формулу Байеса чуть ли не любую исторически сложившуюся базовую оценку, получаешь результат настолько далекий от реальности, что с тем же успехом эту оценку можно было вообще не учитывать. Для многих интересующих нас гипотез ни одно статистическое агентство никогда не высчитывало базовых оценок. (Знаем ли мы, сколько среди студентов ветеринарных школ евреев? А левшей? А трансгендеров?) И что ни говори, с неизвестностью базовых оценок человечеству приходилось мириться на протяжении большей части исторического и доисторического периодов, когда и формировалось наше байесовское чутье.

Так как в байесовской задаче не существует «верной» априорной вероятности, наше пренебрежение заданной экспериментатором базовой оценкой — не обязательно ошибка. Рассмотрим задачу про такси, где в качестве априорных вероятностей предлагалось использовать доли «синих» и «зеленых» таксомоторов в городе. Участники эксперимента вполне могли предположить, что этот простой показатель потонет в более специфических отличиях, например в уровне аварийности компаний или в относительном числе автомобилей, работающих в светлое и темное время суток, или в специфике районов, которые они обслуживают. В таком случае, не располагая этими принципиально важными данными, в качестве априорной вероятности они могли взять нейтральные 50 %. Дальнейшие исследования показали, что участники эксперимента приближаются к байесовскому идеалу, если им сообщают базовые оценки, которые лучше описывают шансы автомобиля попасть в аварию[239].

Кроме того, базовую оценку можно считать априорной вероятностью только при условии, что предъявляемые примеры отобраны в данной популяции случайным образом. Если их выбирали не вслепую, а исходя из наличия интересующей черты, например принадлежности к категории, в которой она проявляется с высокой частотой, — все прогнозы бессмысленны. Вспомним, как испытуемым подсовывали стереотип — Пенелопу, сочинительницу сонетов, или зануду из группы юристов и инженеров — и просили угадать, чему этот человек учится или кем работает. Если респондентов не поставили в известность, что упомянутую Пенелопу выбрали из числа студентов случайным образом (такой вопрос сам по себе звучал бы довольно странно), они могут предположить, что ее и выбрали-то только потому, что ее качества обеспечивают их необходимыми подсказками, что было бы вполне естественно. Более того, подобный подход лег в основу легендарной телеигры под названием What’s My Line? («Чем я занимаюсь?»), где игрокам приходилось угадывать профессию таинственного гостя, выбранного, естественно, не случайно, а потому, что занятие у него — необычное, вроде вышибалы в баре, охотника на крупную дичь, баскетболиста из команды Harlem Globetrotters или полковника Сандерса с эмблемы KFC. Если людей ткнуть носом в случайность выбора (например, на глазах у них вынуть из вазы листок с описанием персонажа), они дают оценки, более близкие к результатам применения формулы Байеса[240].

И наконец, люди чувствительны к разнице между вероятностью в смысле степени уверенности в единичном событии и вероятностью в смысле частоты подобных событий на длительном промежутке времени. Во множестве байесовских задач ставится немного мистический вопрос о вероятности единичного события: не подцепил ли Ирвин болезнь куру, не изучает ли Пенелопа искусствоведение, не синим ли было такси, попавшее в ДТП. Действительно, столкнувшись с подобной проблемой, люди почему-то не кидаются вычислять уровень субъективной уверенности, используя цифры, которые им предоставили. Но мне кажется, их не стоит в этом винить, учитывая, что статистики и сами спорят о смысле вероятности единичного события. И Гигеренцер, и Космидес с Туби считают, что люди не сопоставляют десятичные доли с единичным событием, потому что человеческий разум получает статистическую информацию о мире в иной форме. Мы сталкиваемся с событиями, а не с числами от нуля до единицы. Оперируя этой «естественной частотой», люди прекрасно умеют мыслить по-байесовски и без особого труда решают задачи, сформулированные в таких терминах.

Давайте вернемся к началу главы, к проблеме постановки медицинского диагноза, и переведем эти метафизические доли в конкретные частоты. Забудьте о «некой женщине», подумайте о выборке из тысячи женщин. Десять женщин из каждой тысячи болеют раком груди (это распространенность заболевания в популяции, она же базовая оценка). У девяти из этих десяти больных раком груди женщин результат анализа окажется положительным (это чувствительность анализа). Из тех 990 женщин, у которых рака груди нет, примерно у 89 результат все равно окажется положительным (это уровень ложноположительных результатов). Вот женщина с положительным результатом анализа. Каковы шансы, что у нее действительно рак груди? Несложно подсчитать: в сумме тест оказался положительным у 98 женщин, у девяти из которых действительно рак; делим 9 на 98 и получаем примерно 9 % — вот и весь ответ. Когда задачу ставят таким образом, с ней справляются уже 87 % врачей (сравните с 15 % в исходной формулировке), а также большинство десятилетних детей[241].