Результаты моего анализа продуктивности экономики и паттернов расходования средств в рыночном сегменте товаров массового спроса говорят сами за себя. Со значимостью выше p = 0,05 я продемонстрировал наличие в последнее десятилетие прямой зависимости между расходами потребителей и продуктивностью экономики. Это свидетельствует, что траты покупателей на товары массового спроса в огромной степени определяются данным показателем: вероятно, потому, что в условиях менее продуктивной экономической системы потребители не столь уверены в будущем, а финансовое состояние домохозяйств менее прочно.
Как вы, наверное, уже поняли, этот анализ – полнейшая бессмыслица. Между расходами на товары массового спроса и продуктивностью экономики может наблюдаться тесная корреляция{92}, означающая, что эти две тенденции связаны друг с другом (термин происходит от лат.
Например, в США наблюдается статистическая взаимосвязь между новыми случаями диагностированного аутизма и продажами органических продуктов питания. Посмотрите на приведенный ниже график. Как видите, две кривые явно свидетельствуют о тесной корреляции этих переменных. Означает ли это, что одна является причиной другой? Нет. Скорее всего, это отражение того факта, что сегодня диагноз «аутизм» ставится значительно чаще, чем в прошлом, благодаря гораздо более широкой осведомленности медиков об этой патологии, а употребление в пищу органических продуктов становится все более популярной составляющей здорового образа жизни.
Я не в состоянии доказать отсутствие причинно-следственной связи между диагностикой аутизма и продажами органических продуктов питания, равно как и убедительно обосновать то, что рост продаж видеоигр за последние 40 лет способствовал увеличению населения Индии. Можно, однако, с уверенностью предположить, что оба этих факта имеют лучшие объяснения – как и множество других свидетельств, которые нельзя объяснить данными теориями каузальности.
Кроме того, я глубоко убежден, особенно с учетом способности компьютеров вести поиск среди огромных объемов данных и строить графики, что буквально ничего не стоит найти миллионы показателей с высокой степенью корреляции, не имеющих ни малейшей причинной обусловленности. Ниже приводится знаменитый график, где число фильмов, в которых Николас Кейдж снялся в определенные годы, коррелирует с количеством американцев, утонувших вследствие падения в бассейн.
Пример с Николасом Кейджем и утопленниками абсурден, но весьма показателен: при взгляде на любой подобный график очень легко предположить, не потрудившись вникнуть в детали, что две представленные на нем переменные должны быть связаны, просто потому что они таковыми выглядят. Визуальный образ оказывает мгновенное и мощное воздействие: вы видите только то, что вас хотят заставить увидеть, не замечая тысячи других факторов, проигнорированных ради обнаружения корреляции.
Вышеприведенные примеры невозможно принять всерьез, однако не придется долго смотреть любой выпуск новостей или изучать информационный ресурс, чтобы понять: если два важных события происходят одно за другим, первое зачастую автоматически трактуется как причина второго. Представьте, что вы читаете эту статью через час после выступления премьер-министра Великобритании.
Разочарование невысокой оценкой перспектив производственного сектора, прозвучавшее в речи премьер-министра, вылилось в резкое падение рынков после ее выступления.
Весьма вероятно, что вовсе не речь премьер-министра стала причиной падения рынков. Рынками управляет множество очень сложных факторов, но статья о них привлечет слишком мало читателей. Допустим теперь, что рынки отыграли назад и стремительно выросли через три часа после этой публикации. Тогда тот же новостной источник заявит:
Несмотря на первоначальное падение, рынки восстановились и продемонстрировали стремительный рост после выступления премьер-министра, вдохновленные ее взвешенной и последовательной политикой в отношении производства.
Может быть, истинность этого умозаключения более вероятна, чем предыдущего? Да ничего подобного. Перед нами жонглирование словами на основе чрезмерно упрощенного и крайне избирательного восприятия сложной ситуации. Однако подобные словесные упражнения бывают намного более убедительными, чем попытка тщательно описать реальное положение дел.
Обучение с умом: когда корреляция не означает каузальности
Зачастую каузальность путают с корреляцией. Это весьма распространенная ошибка: на основе наблюдений над двумя переменными, которые ведут себя очень похоже, или при сопоставлении событий, следующих вплотную одно за другим, делается вывод, что одно является причиной другого. Прежде чем выдвинуть предположение о наличии причинной обусловленности, убедитесь, что вы рассмотрели и отвергли все прочие возможности.
1. Третий фактор: одна из самых распространенных ошибок в восприятии корреляции возникает, когда скрытой причиной двух явлений, кажущихся тесно взаимосвязанными, является какой-либо третий фактор. Например, стоимость вашего автомобиля и размер дома могут иметь близкую корреляцию, но это не означает, что одно обусловлено другим. Скорее всего, обе эти характеристики зависят от третьего, обусловливающего их фактора – уровня вашего благосостояния.
2. Действующий фактор, но не причина: одно действительно оказывает существенное влияние на другое, но не обусловливает его. Неслучайно многие очень высокие люди становятся профессиональными баскетболистами. Данная физическая особенность повышает шансы добиться успеха в этом виде спорта, где трудно преуспеть коротышкам. Тем не менее рост не является ни абсолютно необходимым, ни достаточным условием: большинство высоких людей не являются хорошими баскетболистами, и для превращения в сильного игрока необходимо множество других факторов.
3. Взаимная обусловленность: взаимосвязь между двумя элементами реальна, но оба они постоянно воздействуют друг на друга. Так, существует тесная связь между инфляцией и безработицей, но оба параметра одновременно являются и причиной, и следствием, то есть находятся в состоянии постоянной взаимной обусловленности.
4. Чистое совпадение: множество вещей коррелируют по чистой случайности, между ними не существует никаких значимых отношений. К примеру, в последние 20 лет в США увеличилось число сортов пива, а также вырос размер государственного долга. Едва ли эти два параметра как-то связаны между собой.
5. Манипулирование статистикой: внешне впечатляющая корреляция может оказаться результатом избирательного подхода к статистике, когда учитываются только данные, демонстрирующие желаемый результат. Например, в рекламе программы по снижению веса могут активно обсуждаться результаты маленькой выборки сильно похудевших испытуемых, тогда как о других участниках, которым диета абсолютно не помогла, даже не упоминается.
6. Путаница между причиной и следствием: бывает, что две вещи действительно коррелируют, но вы неправильно определяете, какая из них является причиной, а которая следствием. Скажем, депрессия вследствие потери работы может быть ошибочно принята за причину случившегося, а не за его симптом («Наверное, тебя уволили, потому что ты все время был хмурым и думал о плохом»).