Более общая техника называется множественной регрессией; она опирается на тот факт, что мешающий параметр никогда не коррелирует с предполагаемой причиной
Дальше проделаем то же самое для предполагаемого следствия, то есть миролюбия. Сопоставляем индекс миролюбия с мешающим параметром (график справа вверху), измеряем отклонения регрессии, отбрасываем первоначальные данные и заменяем их отклонениями, то есть величиной, на которую реальная миролюбивость каждой из стран отличается от ожидаемой, вычисленной на основе уровня благосостояния. Последний шаг очевиден: сопоставить первые остатки со вторыми (нижний график). Если корреляция значительно отличается от нуля, можно решиться на вывод: удерживая благосостояние на постоянном уровне, демократия действительно является причиной мира.
То, что вы только что наблюдали, — самая суть подавляющего большинства статистических методов, применяемых в эпидемиологии и социальных науках, и называется это основной линейной моделью. Конечный результат ее применения — уравнение, позволяющее предсказать эффект на основании взвешенной суммы предикторов (некоторые из них, предположительно, являются причинами). Обладая хорошим пространственным воображением, можно представить себе прогноз не в виде прямой, но в виде наклонной
Миролюбие = (
Тем самым мы предполагаем, что каждая из этих пяти переменных способна усиливать либо ослаблять стремление к миру. Регрессионный анализ позволяет понять, какая из переменных важна для предсказания эффекта, если остальные удерживаются на постоянном уровне. Но это вовсе не безотказный механизм для доказательства причинно-следственных связей — вам все равно придется интерпретировать переменные, объяснять, каким образом они могут быть связаны, и остерегаться множества ловушек. И тем не менее основная линейная модель — самый распространенный инструмент для распутывания клубка причин и мешающих параметров.
Множественные причины, суммирование и взаимодействие
Алгебра уравнения регрессии не так важна, как масштабная идея, вытекающая из его формы: у любого события всегда есть более одной причины, и все они статистические. Эта мысль кажется элементарной, но широкая публика ею постоянно пренебрегает. Мы слишком часто исходим из убеждения, что у любого события есть лишь одна-единственная, несомненная причина: если было продемонстрировано, что А влияет на В, это якобы доказывает, что С на В повлиять не может. Люди, добившиеся успеха, потратили 10 000 часов, оттачивая свое умение; это будто бы доказывает, что успех — вопрос не таланта, но тренировки. Современные мужчины плачут в два раза чаще своих отцов — вот вам и доказательство, что разница в эмоциональности мужчин и женщин обусловлена не биологически, но социально. Возможность наличия множественных причин — природа
Еще труднее дается идея
Позвольте мне проиллюстрировать их выдуманными данными. Предположим, нам интересно, что делает обезьян пугливыми — наследственность, а именно вид, к которому они принадлежат (капуцины или мармозетки), или среда, где они выросли (наедине с матерью или в большом вольере в обществе других обезьяньих семейств). Предположим, мы умеем измерять пугливость, скажем расстоянием, на которое обезьяны приближаются к резиновой змее. Из двух вероятных причин и одного эффекта можно составить шесть различных комбинаций. Поначалу это кажется сложным, но, как только мы представим данные графически, все становится проще. Давайте начнем с трех самых простых вариантов.
Левый график показывает большое жирное ничего: обезьяна есть обезьяна. Вид неважен (графики совпадают); среда тоже неважна (графики горизонтальны). Средний график демонстрирует, что было бы, если был бы важен вид (капуцины пугливей мармозеток: линия капуцинов расположена выше), а вот среда — нет (представители одного вида одинаково пугливы, если росли в уединении или в компании себе подобных, — это видно из того, что обе линии горизонтальны). Если говорить языком статистики, мы наблюдаем
Теперь давайте поднапряжемся и перечислим варианты со множественными причинами. Их снова три. Как будет выглядеть график, если на пугливость влияет
Средний график куда интереснее. Здесь важны оба фактора, причем каждый из них зависит от другого. Если вы капуцин, то уединенное детство делает вас смелее; а вот если вы мармозетка, то, выросши в отрыве от группы, превратитесь в нюню. Мы наблюдаем
И наконец, взаимодействие причин может сосуществовать с одним или несколькими главными эффектами. На правом графике видно, что уединенное детство делает капуцинов пугливее, но никак не влияет на неизменно уравновешенных мармозеток. Так как эффект для мармозеток не полностью отменяет эффект для капуцинов, мы наблюдаем как главный эффект вида (линия капуцинов выше), так и главный эффект среды (середина отрезка между левыми точками лежит ниже середины отрезка между правыми). Но, когда мы интерпретируем феномен с двумя и более причинами, любое взаимодействие важнее главных эффектов: именно оно позволяет глубже понять, что происходит. Взаимодействие обычно указывает на то, что две причины соединены в одной связи причинно-следственной цепи — это не две отдельные стрелки, которые просто суммируются. В нашем примере такой единой связью может быть миндалевидное тело — часть мозга, играющая ключевую роль в формировании страха: оно может быть, например, пластичным у капуцинов и жестко запрограммированным у мармозеток.
Вооружившись такими инструментами познания, мы готовы осмыслять множественные причины в реальном мире, не ограничивая себя дилеммами вроде «природа или воспитание» и «рождаются ли гениями или становятся». Давайте же обратимся к кое-каким невыдуманным данным.
Что провоцирует серьезное депрессивное расстройство — травмирующее событие или генетическая предрасположенность? На графике показана вероятность эпизода такого депрессивного расстройства для выборки женщин, у которых есть сестра-близнец[363].
В выборку вошли женщины, пережившие серьезный стресс вроде развода, насилия или смерти близкого родственника (правые точки), и женщины, которые с ним не сталкивались (левые точки). Если смотреть сверху вниз, первая линия соответствует женщинам, которые могут быть в высокой степени предрасположены к депрессии, потому что их гомозиготные сестры-близнецы, с которыми у них одинаковы все гены, страдали депрессией. Следующая линия — женщины, в некоторой мере предрасположенные к депрессии: депрессивные эпизоды были у их гетерозиготных сестер, обладательниц генома, совпадающего лишь наполовину. Еще ниже — линия, соответствующая женщинам, в небольшой степени предрасположенным к депрессии: их гетерозиготные сестры с депрессией не сталкивались. И в самом низу мы видим линию для женщин, у который риск ниже всего: их генетически идентичные сестры от депрессии не страдали.
Этот график сообщает нам три вещи. Пережитый опыт важен — мы наблюдаем главный эффект стресса: линии веером расходятся вверх, следовательно, травмирующее событие повышает шансы заболеть депрессией. Гены в целом тоже вносят свой вклад: четыре линии находятся на разной высоте, а значит, чем сильнее генетическая предрасположенность, тем с большей вероятностью человек переживет депрессивный эпизод. Но важнее всего —
Теперь давайте посмотрим, что там с гениями — становятся ими или рождаются? Следующий рисунок, также взятый из реального исследования, демонстрирует рейтинг шахматного мастерства для выборки шахматистов с многолетним опытом, которые отличаются друг от друга по показателю когнитивных способностей и числу игр в год[364]. Судя по графику, практика играет определенную роль: обе линии в целом идут вверх, подтверждая главный эффект настойчивых тренировок. Но и талант себя показывает: линии проходят на разной высоте, что подтверждает главный эффект способностей. Однако основное в этой истории —
Люди и причинно-следственные сети
Как способ понять причинную насыщенность окружающего мира уравнение регрессии довольно бесхитростно: оно просто суммирует горстку взвешенных предикторов. Взаимодействия в нем тоже можно учесть, представив их в виде дополнительных предикторов, полученных путем перемножения взаимодействующих факторов. Уравнение регрессии устроено гораздо проще сетей глубокого обучения, с которыми мы познакомились в главе 3: те учитывают миллионы переменных, соединяя их в длинные, путаные цепочки формул, а не просто сваливают их в одну кучу и высчитывают сумму. Но, каким бы оно ни было простым, психология XX в. подарила нам ошеломительный факт: как правило, примитивное уравнение регрессии справляется с задачей лучше специалиста-человека. Это открытие, сделанное психологом Полом Милем, известно под названием «сравнение клинического и актуарного суждения»[365].