• Вероятность, что эффект реален, превышает 0,95.
• Если вы опровергли нулевую гипотезу, шанс, что вы ошиблись, составляет менее 0,05.
• Если вы попытаетесь воспроизвести исследование, шанс, что вам это удастся, составляет более 0,95.
Девять из десяти профессоров психологии, включая 80 % тех, кто преподает статистику, так и думают[303]. Но они ошибаются, ошибаются и еще раз ошибаются! Если вы внимательно следили за рассуждениями в этой главе и в главе 5, вы понимаете почему. «Статистическая значимость» — это байесовское правдоподобие, вероятность получения определенных данных при условии, если гипотеза верна (в нашем случае нулевая гипотеза)[304]. Однако каждое из перечисленных выше утверждений представляет собой байесовскую апостериорную вероятность — вероятность, что гипотеза верна при условии получения определенных данных. Вот что нам нужно, вот зачем мы взялись за исследование — но проверка на статистическую значимость показывает совсем не это! Если вы помните, почему у Ирвина нет заболевания печени, почему дома не так уж опасно и почему папа римский не инопланетянин, вы знаете, что эти две условные вероятности нельзя менять местами. Наша исследовательница не может использовать тест на статистическую значимость в качестве оценки истинности или ложности нулевой гипотезы, если она не учтет априорную вероятность — ее наилучшее предположение о вероятности, что нулевая гипотеза истинна, сформулированное до эксперимента. Но в математике проверок на статистическую значимость эту самую априорную вероятность днем с огнем не сыщешь!
Специалисты по общественным наукам в массе своей настолько привыкли к ритуалу проверки на статистическую значимость, которой озабочены с младых ногтей, что позабыли логику, которая за ней стоит. Я понял это, сотрудничая с лингвистом-теоретиком Джейн Гримшоу, которая, поднаторев в статистике, однажды сказала мне: «Давай-ка разберемся: единственное, что эти тесты показывают, так это то, что, если эффекта не существует, один из двадцати ученых, которые его ищут, будет утверждать, что эффект есть. Почему ты так уверен, что это не ты?» Честный ответ: ни почему. За ее скептицизмом кроется еще одно объяснение кризиса воспроизводимости. Допустим, подобно кэрролловским охотникам на снарка, двадцать ученых гоняются за неким миражом. Девятнадцать прячут свои нулевые результаты поглубже в ящик стола, а тот единственный, кому повезло (или не повезло) совершить ошибку первого рода, публикует свое «открытие»[305]. В одном выпуске комикса XKCD пара ученых проверяет наличие корреляции между поеданием мармеладных драже и подростковыми угрями отдельно по двадцати цветам и пожинает лавры, увязав зеленые драже с прыщавостью с p < 0,05[306]. До ученых наконец дошла эта шутка: они приучаются публиковать нулевые результаты и разрабатывают методики, способные компенсировать проблему «ящика стола» при метаанализе литературы, то есть исследовании исследований. Отсутствие нулевых результатов бросается в глаза, и тот, кто проводит метаанализ, может зафиксировать не только то ничто, которое есть, но и то, которого нет[307].
Постыдное непонимание смысла проверки на статистическую значимость сообщает нам нечто важное о человеческих устремлениях. Философы, начиная с Юма, отмечали, что индукция — переход от отдельных наблюдений к общему выводу — по природе своей ненадежный вид логического рассуждения[308]. Через любое конечное множество точек можно провести бесконечное число кривых; любому набору данных может логически не противоречить бесконечное множество теорий. Инструменты рациональности, о которых я рассказал в этих главах, предлагают разные способы совладать с таким вселенским невезением. Теория статистических решений не позволяет отыскать истину, но позволяет ограничить ущерб от ошибок первого и второго рода. Байесовское мышление помогает устанавливать степень уверенности в истине, но начинать тут всегда нужно с вычисления априорной вероятности, при всей присущей этому процессу субъективности. Однако ни та ни другая теория не может дать нам того, чего мы все так жаждем, — готового алгоритма установления истины.
Глава 8. Я и другие (теория игр)
Ваша рожь поспела сегодня; моя будет готова завтра; для нас обоих выгодно, чтобы я работал с вами сегодня и чтобы вы помогли мне завтра. Но у меня нет расположения к вам, и я знаю, что вы также мало расположены ко мне. Поэтому ради вас я не возьму на себя лишней работы, а если бы я стал помогать вам ради себя самого в ожидании ответной услуги, то знаю, что меня постигло бы разочарование и что я напрасно стал бы рассчитывать на вашу благодарность. Итак, я предоставляю вам работать в одиночку; вы отвечаете мне тем же; погода меняется; и мы оба лишаемся урожая вследствие недостатка во взаимном доверии и невозможности рассчитывать друг на друга.
Недавно мы с коллегой поспорили о том, какое послание должен адресовать миру наш университет по вопросу глобального потепления. По мнению моего оппонента, нам просто нужно убеждать людей, что сокращение объема производимых ими парниковых газов отвечает их личным интересам, поскольку перегретая планета — это наводнения, ураганы, лесные пожары и другие бедствия, от которых они же и пострадают. Я же говорил, что разумное потребление отнюдь
Тогда-то я и понял, что этот прекрасный специалист упускает из виду принципиально важную концепцию — теорию игр, подсказывающую, как делать рациональный выбор, когда размер твоего вознаграждения зависит от рационального выбора
С теорией игр мир познакомили фон Нейман и Моргенштерн — в той же самой книге, где объясняли, что такое ожидаемая полезность и рациональный выбор[310]. Но в отличие от дилемм, в рамках которых мы испытываем судьбу, играя против безмозглого колеса фортуны, и где, как оказалось, наилучшие стратегии в целом интуитивны, теория игр имеет дело с дилеммами, сталкивающими нас с равно хитроумными игроками, и тут уж исходы выворачивают наши интуитивные догадки наизнанку и переворачивают их с ног на голову. Жизненные игры порой не оставляют рациональному агенту выбора: он вынужден совершать поступки, от которых пострадает и он сам, и все остальные, вести себя беспорядочно, капризно или неуправляемо, лелеять симпатии и копить обиды, с готовностью переносить наказания и подвергаться взысканиям или вовсе отказываться участвовать в игре. Теория игр проливает свет на парадоксальную рациональность, стоящую за многими странностями общественной и политической жизни, и, как станет понятно в одной из последующих глав, помогает ответить на центральный вопрос этой книги: как наш рациональный вид может быть таким нерациональным?
Игра с нулевой суммой: камень, ножницы, бумага
Классическая дилемма теории игр, где четко видно, как выгодность выбора одного участника зависит от выбора другого, — игра «Камень, ножницы, бумага»[311]. Два игрока одновременно показывают какой-то из жестов: либо два пальца (ножницы), либо открытую ладонь (бумага), либо кулак (камень), — а победитель определяется согласно правилу «ножницы режут бумагу, бумага обертывает камень, камень тупит ножницы». Правила можно представить в виде таблицы: выборы первого игрока, Аманды, записаны в строках, выборы второго игрока, Брэда, — в столбцах, а исходы — в ячейках: для Аманды в нижнем левом углу, для Брэда в верхнем правом. Давайте присвоим исходам численные значения: 1 — победа, –1 — проигрыш, 0 — ничья.
Сумма выигрышей Аманды и Брэда равна нулю в каждой ячейке, отсюда и термин, который проник из теории игр в разговорную речь: игра с нулевой суммой. Победа Аманды — это поражение Брэда, и наоборот. Игроки находятся в состоянии непримиримого конфликта и дерутся за один и тот же кусок пирога.
Какой ход (строку) должна выбрать Аманда? Основной алгоритм в теории игр (да и в жизни тоже) — взглянуть на ситуацию глазами другого игрока. Аманда должна изучить выборы Брэда (столбцы) один за другим. Проследим слева направо: если Брэд выбирает ножницы, Аманде нужно выбрать камень. Если он выбирает бумагу, ей нужно выбрать ножницы. Если он выбирает камень, ей нужно выбрать бумагу. У Аманды нет никакого «предпочтительного» выбора — наилучшего вне зависимости от того, что сделает Брэд; а Аманда, естественно, понятия не имеет, что он собирается делать.
Однако это еще не значит, что Аманда должна выбрать какой-то один ход, бумагу например, и упрямо его придерживаться. Если она так поступит, Брэд это заметит, станет все время показывать ножницы и будет раз за разом одерживать верх. Более того, даже если Аманда станет выбирать бумагу всего лишь немного чаще, чем другие варианты (скажем, в 40 % случаев, а каждый из двух других — в 30 %), Брэд может сделать ставку на ножницы и побеждать четыре раза из семи. Наилучшая стратегия для Аманды — превратиться в человека-рулетку и выбирать ходы случайным образом с одной и той же вероятностью, исключая любой уклон, крен, дрейф или шаг в сторону от идеального разбиения 1/3–1/3–1/3.
Поскольку приведенная выше таблица симметрична относительно диагонали, Брэду нужно вести себя точно так же. Когда он, строка за строкой, обдумывает варианты действий Аманды, у него нет оснований предпочесть один из своих ходов двум другим, и, следовательно, он вынужден придерживаться той же «смешанной» стратегии, разыгрывая каждый вариант с вероятностью 1/3. Если же Брэд от нее отступит, Аманда изменит свою линию поведения, чтобы этим воспользоваться, и наоборот. Игроки зависли в
Открытие, что в некоторых ситуациях рациональный агент должен вести себя сверхчеловечески неупорядоченно, — лишь один из выводов теории игр, который кажется абсурдным, пока не осознаешь, что в жизни таких ситуаций полно. Равновесие игры «Камень, ножницы, бумага» называют коллизией угадывания, и ее нередко можно наблюдать в таких видах спорта, как теннис, бейсбол, хоккей или футбол. Футболист, бьющий пенальти, может послать мяч либо в правый угол ворот, либо в левый, а вратарь может защитить либо левый угол, либо правый; в такой ситуации непредсказуемость — первостепенное достоинство. Блеф в покере и внезапные атаки в военной стратегии — те же коллизии угадывания. Даже если действие выбирается не в буквальном смысле случайно (скорее всего, в 1944 г. союзники не подбрасывали монетку, чтобы решить, где высаживаться — в Нормандии или в районе Кале), игрок должен сделать каменное лицо, чтобы не выдать себя ни словом, ни взглядом и заставить оппонентов
Игра с ненулевой суммой: дилемма добровольца
Рациональные агенты попадают в коллизию угадывания не только в играх с нулевой суммой, но и в ситуациях, когда их интересы отчасти совпадают. Пример — дилемма добровольца, которую прекрасно иллюстрирует средневековая басня «Колокольчик для кошки». Мышь предлагает товаркам повесить колокольчик на шею спящей кошки, чтобы звон оповещал о приближении хищника. Вопрос, конечно же, в том, кто именно повесит колокольчик, рискуя разбудить кошку и быть съеденным. Люди тоже сталкиваются с похожими дилеммами: например, кто из пассажиров схлестнется с угонщиком самолета, кто из прохожих поможет человеку в беде и кто из офисных работников почистит кофеварку на общей кухне[313]. Каждый хочет, чтобы кто-нибудь это сделал, и каждый предпочел бы, чтобы это был не он. Если обозначить издержки и выгоды числами (0 — худшее, что может случиться), мы получим таблицу, приведенную ниже. (Точнее, это должен быть гиперкуб с числом измерений, равным числу игроков, но я свернул всех, кроме «себя», в один слой.)