Книги

Рациональность. Что это, почему нам ее не хватает и чем она важна

22
18
20
22
24
26
28
30

Более общая техника называется множественной регрессией; она опирается на тот факт, что мешающий параметр никогда не коррелирует с предполагаемой причиной идеально. Оказалось, что расхождения между ними — не назойливый шум, но красноречивая информация. Вот как это работает с демократией, миром и ВВП на душу населения. Первым делом сопоставим предполагаемую причину, индекс демократии, с мешающим параметром (график слева вверху); каждая точка обозначает страну. (Данные взяты с потолка исключительно для иллюстрации логики.) Далее строим прямую регрессии и смотрим на отклонения регрессии — вертикальные расстояния между каждой точкой и прямой, соответствующие разнице между индексом демократии страны, каким он был бы, если бы доход идеально предсказывал бы уровень демократии, и реальным индексом демократии. Теперь заменим реальные индексы демократии всех стран на эти отклонения регрессии, то есть на показатели демократии при статистически контролируемом ВВП.

Дальше проделаем то же самое для предполагаемого следствия, то есть миролюбия. Сопоставляем индекс миролюбия с мешающим параметром (график справа вверху), измеряем отклонения регрессии, отбрасываем первоначальные данные и заменяем их отклонениями, то есть величиной, на которую реальная миролюбивость каждой из стран отличается от ожидаемой, вычисленной на основе уровня благосостояния. Последний шаг очевиден: сопоставить первые остатки со вторыми (нижний график). Если корреляция значительно отличается от нуля, можно решиться на вывод: удерживая благосостояние на постоянном уровне, демократия действительно является причиной мира.

То, что вы только что наблюдали, — самая суть подавляющего большинства статистических методов, применяемых в эпидемиологии и социальных науках, и называется это основной линейной моделью. Конечный результат ее применения — уравнение, позволяющее предсказать эффект на основании взвешенной суммы предикторов (некоторые из них, предположительно, являются причинами). Обладая хорошим пространственным воображением, можно представить себе прогноз не в виде прямой, но в виде наклонной плоскости, парящей над нулевым уровнем, заданным значениями двух предикторов. В принципе, в это уравнение можно ввести сколько угодно предикторов, создав гиперплоскость в гиперпространстве и поставив в тупик свое беспомощное воображение (которому и с тремя-то измерениями непросто справиться), но, если говорить о математике, нам всего лишь придется прибавить к формуле парочку новых слагаемых. Что касается мира, уравнение будет выглядеть так:

Миролюбие = (a × демократия) + (b × ВВП на душу населения) + (c × торговля) + (d × членство в международных организациях) + (e × образование).

Тем самым мы предполагаем, что каждая из этих пяти переменных способна усиливать либо ослаблять стремление к миру. Регрессионный анализ позволяет понять, какая из переменных важна для предсказания эффекта, если остальные удерживаются на постоянном уровне. Но это вовсе не безотказный механизм для доказательства причинно-следственных связей — вам все равно придется интерпретировать переменные, объяснять, каким образом они могут быть связаны, и остерегаться множества ловушек. И тем не менее основная линейная модель — самый распространенный инструмент для распутывания клубка причин и мешающих параметров.

Множественные причины, суммирование и взаимодействие

Алгебра уравнения регрессии не так важна, как масштабная идея, вытекающая из его формы: у любого события всегда есть более одной причины, и все они статистические. Эта мысль кажется элементарной, но широкая публика ею постоянно пренебрегает. Мы слишком часто исходим из убеждения, что у любого события есть лишь одна-единственная, несомненная причина: если было продемонстрировано, что А влияет на В, это якобы доказывает, что С на В повлиять не может. Люди, добившиеся успеха, потратили 10 000 часов, оттачивая свое умение; это будто бы доказывает, что успех — вопрос не таланта, но тренировки. Современные мужчины плачут в два раза чаще своих отцов — вот вам и доказательство, что разница в эмоциональности мужчин и женщин обусловлена не биологически, но социально. Возможность наличия множественных причин — природа и воспитание, талант и тренировка — не принимается во внимание.

Еще труднее дается идея взаимодействия причин — ситуации, когда эффект одной причины зависит от другой. Может, тренировки всем на пользу, но талантливые выигрывают от них больше. Нам остро необходим новый язык для обсуждения и осмысления множественных причин. Вот еще одна область, где пара простых статистических понятий любого сделает умнее. Эти расширяющие сознание понятия — главный эффект и взаимодействие.

Позвольте мне проиллюстрировать их выдуманными данными. Предположим, нам интересно, что делает обезьян пугливыми — наследственность, а именно вид, к которому они принадлежат (капуцины или мармозетки), или среда, где они выросли (наедине с матерью или в большом вольере в обществе других обезьяньих семейств). Предположим, мы умеем измерять пугливость, скажем расстоянием, на которое обезьяны приближаются к резиновой змее. Из двух вероятных причин и одного эффекта можно составить шесть различных комбинаций. Поначалу это кажется сложным, но, как только мы представим данные графически, все становится проще. Давайте начнем с трех самых простых вариантов.

Левый график показывает большое жирное ничего: обезьяна есть обезьяна. Вид неважен (графики совпадают); среда тоже неважна (графики горизонтальны). Средний график демонстрирует, что было бы, если был бы важен вид (капуцины пугливей мармозеток: линия капуцинов расположена выше), а вот среда — нет (представители одного вида одинаково пугливы, если росли в уединении или в компании себе подобных, — это видно из того, что обе линии горизонтальны). Если говорить языком статистики, мы наблюдаем главный эффект вида — это значит, что этот эффект наблюдается во всех случаях и от среды не зависит. Правый график иллюстрирует противоположную ситуацию — главный эффект среды, но не вида. Обезьяны, выросшие в уединении, трусливей (графики наклонны), но касается это как капуцинов, так и мармозеток (графики совпадают).

Теперь давайте поднапряжемся и перечислим варианты со множественными причинами. Их снова три. Как будет выглядеть график, если на пугливость влияет и среда, и вид, если капуцины как вид пугливее мармозеток и несоциализированная обезьяна вырастает пугливей? Левый график иллюстрирует как раз такую ситуацию — здесь мы наблюдаем два главных эффекта. Линии наклонны и идут параллельно друг другу одна над другой.

Средний график куда интереснее. Здесь важны оба фактора, причем каждый из них зависит от другого. Если вы капуцин, то уединенное детство делает вас смелее; а вот если вы мармозетка, то, выросши в отрыве от группы, превратитесь в нюню. Мы наблюдаем взаимодействие вида и среды, которое на графике выражается двумя непараллельными линиями. В нашем случае они пересекаются почти под прямым углом, а это значит, что главные эффекты полностью обнуляют друг друга. Суммарно вид неважен: середина линии капуцинов совпадает с серединой линии мармозеток. Среда суммарно тоже неважна: средний уровень трусливости для социализированного животного, соответствующий середине отрезка, соединяющего левые точки, равен среднему уровню для одиночки, соответствующему середине отрезка, соединяющего правые точки. Конечно, в действительности значение имеют и вид, и среда, просто то, какое значение имеет каждая из причин, зависит от другой.

И наконец, взаимодействие причин может сосуществовать с одним или несколькими главными эффектами. На правом графике видно, что уединенное детство делает капуцинов пугливее, но никак не влияет на неизменно уравновешенных мармозеток. Так как эффект для мармозеток не полностью отменяет эффект для капуцинов, мы наблюдаем как главный эффект вида (линия капуцинов выше), так и главный эффект среды (середина отрезка между левыми точками лежит ниже середины отрезка между правыми). Но, когда мы интерпретируем феномен с двумя и более причинами, любое взаимодействие важнее главных эффектов: именно оно позволяет глубже понять, что происходит. Взаимодействие обычно указывает на то, что две причины соединены в одной связи причинно-следственной цепи — это не две отдельные стрелки, которые просто суммируются. В нашем примере такой единой связью может быть миндалевидное тело — часть мозга, играющая ключевую роль в формировании страха: оно может быть, например, пластичным у капуцинов и жестко запрограммированным у мармозеток.

Вооружившись такими инструментами познания, мы готовы осмыслять множественные причины в реальном мире, не ограничивая себя дилеммами вроде «природа или воспитание» и «рождаются ли гениями или становятся». Давайте же обратимся к кое-каким невыдуманным данным.

Что провоцирует серьезное депрессивное расстройство — травмирующее событие или генетическая предрасположенность? На графике показана вероятность эпизода такого депрессивного расстройства для выборки женщин, у которых есть сестра-близнец[363].

В выборку вошли женщины, пережившие серьезный стресс вроде развода, насилия или смерти близкого родственника (правые точки), и женщины, которые с ним не сталкивались (левые точки). Если смотреть сверху вниз, первая линия соответствует женщинам, которые могут быть в высокой степени предрасположены к депрессии, потому что их гомозиготные сестры-близнецы, с которыми у них одинаковы все гены, страдали депрессией. Следующая линия — женщины, в некоторой мере предрасположенные к депрессии: депрессивные эпизоды были у их гетерозиготных сестер, обладательниц генома, совпадающего лишь наполовину. Еще ниже — линия, соответствующая женщинам, в небольшой степени предрасположенным к депрессии: их гетерозиготные сестры с депрессией не сталкивались. И в самом низу мы видим линию для женщин, у который риск ниже всего: их генетически идентичные сестры от депрессии не страдали.

Этот график сообщает нам три вещи. Пережитый опыт важен — мы наблюдаем главный эффект стресса: линии веером расходятся вверх, следовательно, травмирующее событие повышает шансы заболеть депрессией. Гены в целом тоже вносят свой вклад: четыре линии находятся на разной высоте, а значит, чем сильнее генетическая предрасположенность, тем с большей вероятностью человек переживет депрессивный эпизод. Но важнее всего — взаимодействие: линии не параллельны. (Можно сказать и иначе: левые точки почти совпадают, а правые сильно разнесены.) Если человек не столкнулся с травмирующим событием, влияние генов почти незаметно: каким бы ни был геном, вероятность пережить депрессивный эпизод не превышает 1 %. Но в присутствии стресса гены приобретают огромное значение: полный набор генетических признаков, связанных с устойчивостью к депрессии, удерживает риск заболеть на уровне 6 % (нижняя линия); полный набор генетических признаков, связанных с уязвимостью к депрессии, повышает риск более чем в два раза, до 14 % (верхняя линия). Взаимодействие сообщает нам не только о том, что свой вклад в развитие депрессии вносят как гены, так и среда, но и о том, что они, похоже, влияют на одну и ту же стрелку причинно-следственной цепи. Гены, в разной степени общие для этих близнецов, — это не гены депрессии как таковые, это гены уязвимости или устойчивости к травмирующему опыту.

Теперь давайте посмотрим, что там с гениями — становятся ими или рождаются? Следующий рисунок, также взятый из реального исследования, демонстрирует рейтинг шахматного мастерства для выборки шахматистов с многолетним опытом, которые отличаются друг от друга по показателю когнитивных способностей и числу игр в год[364]. Судя по графику, практика играет определенную роль: обе линии в целом идут вверх, подтверждая главный эффект настойчивых тренировок. Но и талант себя показывает: линии проходят на разной высоте, что подтверждает главный эффект способностей. Однако основное в этой истории — взаимодействие: линии не параллельны, а значит, чем умнее шахматист, тем больше пользы приносит ему каждая сыгранная игра. Другими словами, без практики когнитивные способности ничего не значат (левые точки графиков практически совпадают), но практика подчеркивает талант интеллектуально одаренных игроков (расстояние между правыми точками больше). Зная разницу между главными эффектами и взаимодействием, мы не просто не купимся на ложные дихотомии, но сможем глубже понять природу глубинных причин происходящего.

Люди и причинно-следственные сети

Как способ понять причинную насыщенность окружающего мира уравнение регрессии довольно бесхитростно: оно просто суммирует горстку взвешенных предикторов. Взаимодействия в нем тоже можно учесть, представив их в виде дополнительных предикторов, полученных путем перемножения взаимодействующих факторов. Уравнение регрессии устроено гораздо проще сетей глубокого обучения, с которыми мы познакомились в главе 3: те учитывают миллионы переменных, соединяя их в длинные, путаные цепочки формул, а не просто сваливают их в одну кучу и высчитывают сумму. Но, каким бы оно ни было простым, психология XX в. подарила нам ошеломительный факт: как правило, примитивное уравнение регрессии справляется с задачей лучше специалиста-человека. Это открытие, сделанное психологом Полом Милем, известно под названием «сравнение клинического и актуарного суждения»[365].