Как всегда, не застрахованы от таких ошибок и ученые. У кризиса воспроизводимости есть и еще одна причина: экспериментаторы не учитывают разновидность регрессии к среднему, которая называется «проклятием победителя». Для того чтобы интересующий нас эффект подтвердился экспериментально, много чего должно пойти так, как надо, — и неважно, реален эффект или нет. Может, сегодня экспериментатору улыбнулась удача — но не факт, что так случится и завтра, а значит, пытаясь воспроизвести результат, ему нужно привлечь к эксперименту больше участников. Но ученые обычно думают, что раз они уже собрали кое-какие доказательства, то могут обойтись меньшим числом участников, не осознавая, что такая стратегия ведет их прямиком к публикации в «Журнале невоспроизводимых результатов»[342]. На неспособности понять, как регрессия к среднему влияет на поразительные открытия, основаны аргументы нелепой статьи «Исчезающие истины» (The Truth Wears Off), опубликованной в 2010 г. журналом The New Yorker; там постулировался загадочный «эффект снижения», который, по мнению автора, ставит под сомнение сам научный метод[343].
Проклятие победителя распространяется на любое наше необычайно успешное начинание, и неумение вводить поправку на неповторимые мгновения удачи, возможно, отчасти объясняет, почему жизнь так часто нас разочаровывает.
Что такое причинно-следственная связь?
Прежде чем попытаться перекинуть мост от корреляции к причинности, давайте проведем разведку на противоположном берегу, то есть рассмотрим саму причинность, которая оказалась на удивление расплывчатой концепцией[344]. Дэвид Юм в очередной раз определил ход дискуссии на столетия вперед, предположив, что причинность — это просто ожидание, что корреляция, с которой мы столкнулись в прошлом, сохранится и в будущем[345]. Если мы уже неоднократно наблюдали за игрой в бильярд, то всякий раз, увидев, как один шар приближается к другому, мы, опираясь на подразумеваемое, но недоказуемое допущение, что законы природы устойчивы во времени, ожидаем, что этот другой, как всегда, устремится вперед.
Нетрудно понять, почему «устойчивая конъюнкция» — плохой фундамент для теории причинности. Петух всегда кукарекает перед рассветом, но мы же не думаем, что это петух заставляет солнце вставать. Гром часто предшествует лесным пожарам, но мы же не утверждаем, будто гром вызывает пожар. Все это — эпифеномены; их еще называют мешающими параметрами — они сопутствуют событию, но не вызывают его. Эпифеномены — проклятье эпидемиологии. Годами кофе винили в болезнях сердца, потому что с любителями кофе инфаркты случаются чаще. Оказалось, однако, что эти люди к тому же больше курят и не занимаются спортом, а кофе — просто эпифеномен.
Юм предчувствовал такой поворот и развил свою идею: причина должна не просто регулярно предшествовать следствию — важно, что «если бы не было первого объекта, то никогда не существовало бы и второго»{32}. Ключевая оговорка «если бы не было» — это контрфактическое предположение «что, если». Что произошло бы в возможном мире, в другой вселенной, в гипотетическом эксперименте? В параллельной вселенной, где не было причины, не случилось бы и следствия. Контрфактическое определение причинности решает проблему эпифеноменов. Мы не считаем, что петух вызывает рассвет, потому что, если петух накануне вечером угодил в суп, солнце все равно встанет. Мы утверждаем, что молния способна стать причиной лесного пожара, а гром — нет, потому что молния без грома может поджечь лес, а гром без молнии — не может.
Следовательно, причинность можно понимать как разницу в исходах, когда некое событие (причина) происходит и когда оно не происходит[346]. Суть «фундаментальной проблемы причинно-следственного вывода», как называют ее статистики, в том, что мы застряли во вселенной, где предполагаемое причинное событие либо произошло, либо нет. Нам не под силу заглянуть в другую и посмотреть, что же случилось там. Мы можем, конечно, сравнивать исходы в той вселенной, что есть под рукой, но только в разные моменты: когда события интересующего нас типа происходят и когда они не происходят. Но здесь мы с разбегу утыкаемся в проблему, на которую еще в VI веке до н. э. указывал Гераклит: в одну и ту же реку нельзя войти дважды. За время, прошедшее между наблюдениями, в мире могло измениться что-то еще, и мы не можем знать наверняка, не является ли истинной причиной наблюдаемого исхода какое-то из этих изменений. Кроме этого, мы можем сравнивать между собой отдельные объекты, одни из которых испытали на себе действие некоторого события, а другие — нет. Но на этом пути нас поджидает проблема, подмеченная доктором Сьюзом:
Сегодня ты есть ты, что верного верней.
Тебей тебя на свете нет людей{33}.
Каждый отдельный объект уникален, и мы не можем знать наверняка, чем вызвано то, что с ним произошло, — предполагаемой причиной или какой-то из его бесчисленных особенностей. Чтобы выводить причинность из подобных сравнений, нам приходится принимать допущения с прозаическими названиями типа «неизменности во времени» и «однородности единиц». Методы, которым посвящены два следующих раздела, пытаются обосновать эти допущения с позиции рациональности.
Даже если мы установили, что какие-то причины действительно меняют исход, ни ученые, ни обычные люди не готовы этим довольствоваться. В нашем представлении причина связана со следствием неким механизмом, и мы хотим видеть, как крутятся его шестеренки. Люди интуитивно понимают, что мир — не видеоигра, где одни совокупности пикселей произвольно сменяются другими. За каждым изменением стоит скрытая сила, энергия или влияние. Наука развенчала многие из наших интуитивных представлений о движущих силах, например об «импетусе», который, согласно средневековым воззрениям, придается движущимся предметам, а заодно о психической энергии, энергии ци, инграммах, биополях, гомеопатических миазмах, целебных свойствах минералов и прочем вздоре из области альтернативной медицины. Но некоторые из интуитивно понимаемых механизмов, например гравитация, уцелели в виде почтенного научного знания. Пытаясь объяснить наблюдаемые корреляции, ученые обнаруживали новые, неизвестные ранее механизмы: гены, патогены, литосферные плиты и элементарные частицы. Именно механизмы, связывающие причину со следствием, позволяют нам предсказывать, что произошло бы при контрфактическом сценарии, не оказываясь в царстве чистой фантазии: мы создаем мнимый мир и моделируем в нем интересующие нас механизмы, а уже они обеспечивают все остальное.
* * *
Но даже если научиться понимать причинность в терминах альтернативных исходов и порождающих их механизмов, любая попытка установить «ту самую» причину заводит нас в чащу головоломок. Одна из них — трудноуловимая разница между причиной и условием. Мы говорим: трение спички о коробок является причиной воспламенения, ведь без трения не было бы и огня. Но в отсутствие кислорода, или если бы бумага была мокрая, или если бы по комнате гуляли сквозняки, огонь тоже бы не занялся. Так почему же мы не говорим «наличие кислорода стало причиной воспламенения»?
Вторая сложность — вариативность причин. Предположим, чисто теоретически, что у Ли Харви Освальда был сообщник, в 1963 г. прятавшийся на поросшем травой холме в Далласе; они договорились, что стреляет тот, кому первому представится хорошая возможность для выстрела; второй же сливается с толпой. В контрфактическом мире, в котором Освальд не выстрелил, Кеннеди все равно бы погиб, хотя было бы странно отрицать, что в нашем мире, где Ли Харви Освальд выстрелил прежде сообщника, именно его выстрел и стал причиной гибели Кеннеди.
Третья — множественность равнозначных причин. Осужденного на смерть казнит расстрельная команда, а не единственный палач, чтобы ни одному из стрелявших не пришлось нести страшное бремя причинителя смерти: если бы он не выстрелил, осужденный все равно бы погиб. Но тогда, согласно логике контрфактического рассуждения, никто из стрелявших в него не стал причиной смерти осужденного.
А еще есть вероятностная причинность. У многих из нас есть знакомый девяностолетний старик, который всю жизнь выкуривал по пачке в день. Но в наше время вряд ли многие станут утверждать, будто его преклонный возраст доказывает, что курение не вызывает рака, хотя к такому «опровержению» нередко прибегали во времена, когда связь курения и рака еще можно было отрицать. Даже сегодня многие постоянно путают неидеальную причинно-следственную связь с ее отсутствием. В 2020 г. автор редакционной статьи в The New York Times призывал упразднить полицию, потому что «нынешний подход не покончил с проблемой [изнасилований]. Большая часть насильников так никогда и не предстала перед судом»[347]. Автор не учел, что в отсутствие правоохранительных органов перед судом вряд ли представал бы хоть кто-то, и уж точно еще меньше насильников.
Понять парадоксы причинности можно, только позабыв о бильярдных шарах и признав, что не бывает событий с единственной причиной. События путаются в сети причин, которые, соединяясь и разветвляясь, вызывают, обусловливают, подавляют, предотвращают и усиливают друг друга. Четыре головоломки причинности можно разгадать, начертив схему причинно-следственной связи для каждой из них, как показано ниже.
Если воспринимать каждую стрелку не как логическое следствие («Если Х курит, то Х заработает болезнь сердца»), но как условную вероятность («Вероятность, что Х заработает болезнь сердца при условии, что Х курит, выше вероятности, что Х заработает болезнь сердца при условии, что Х не курит») и думать об узлах событий не как о переключателях «да-нет», но как о вероятностях, отражающих базовую оценку или априорную вероятность, — такую диаграмму называют байесовской сетью[348]. Переходя по сети от узла к узлу и применяя (само собой) правило Байеса, можно проследить, как разворачиваются события. Каким бы запутанным ни было хитросплетение причин, условий и мешающих параметров, байесовская сеть позволяет определить, какие события причинно зависимы, а какие независимы друг от друга.
Придумал такие сети ученый-информатик Джуда Перл; он отмечает, что построены они из трех простых мотивов — линейная цепь, разветвление и коллайдер, каждый из которых описывает одну из фундаментальных (хотя и интуитивно не очевидных) характеристик причинно-следственной связи с более чем одной причиной.
Эти связи отражают условные вероятности. В каждом случае А и С связаны не напрямую, что означает, что вероятность А при условии В можно определить независимо от вероятности С при условии В. И в каждом случае о связи между ними можно сказать нечто особенное.
В причинной цепи первая причина, А, «экранирована» от конечного эффекта, С; она влияет на него только через В. Для появления С наличие А вообще не обязательно. Подумайте о системе пожарной сигнализации в гостинице, работу которой можно описать цепью «пожар → дым → тревога». На самом деле это не пожарная сигнализация, но сигнализация о задымлении или даже о любой взвеси в воздухе. Сирена может перебудить гостей и из-за того, что кто-нибудь красит книжную полку из распылителя недалеко от датчика дыма, и из-за чадящей горелки для приготовления крем-брюле.
Причинное разветвление нам уже знакомо: оно описывает эпифеномен и сопутствующую ему опасность ошибиться в определении истинной причины. Возраст (В) влияет на словарный запас (А) и размер обуви (С): чем старше ребенок, тем больше у него нога и тем больше слов он знает. Очевидно, что объем словарного запаса коррелирует с размером ноги, но вряд ли мы посоветуем детским садам готовить детей к школе, снабжая их кроссовками большего размера.
Не меньшую опасность таит и коллайдер, где не связанные друг с другом причины сходятся к единому следствию. На самом деле он еще опаснее, ведь большинство из нас без пояснений осознают ошибку мешающего параметра (смеются шуткам на эту тему), а вот «искажение коллайдера» практически неизвестно. Имея дело с причинным коллайдером и фокусируясь на ограниченном диапазоне эффектов, мы получаем опасность установить несуществующую отрицательную корреляцию между причинами, поскольку одна причина будет компенсировать другую. Бывалые пользовательницы приложений для знакомств порой недоумевают, почему красивые мужчины такие сволочи. Это утверждение может быть клеветой на красавцев, и не стоит тратить время попусту, высасывая из пальца объяснительные теории типа той, будто хорошо выглядящих мужчин испортили толпы поклонниц и поклонников, которые с детства им потакали. Многие женщины готовы встречаться с мужчиной (В) только при условии, что он либо красавец (А), либо хороший человек (С). Даже если доброта и приятная внешность вообще не коррелируют в массиве потенциальных партнеров, мужчины заурядной наружности должны быть добрыми, иначе женщины просто не станут с ними встречаться, а вот красавцы подобного отбора не проходят. Ложная отрицательная корреляция вводится дизъюнктивной разборчивостью женщин.