Вероятность
Ловушка в формуле вероятности конъюнкции кроется в оговорке
Ошибки в оценке независимости событий могут привести к глупейшим просчетам. Когда череда редких явлений затрагивает не изолированные друг от друга элементы: соседей по подъезду, заражающих друг друга гриппом, или членов одной социальной группы, перенимающих привычки друг у друга, или ответы одного-единственного респондента, который проявляет одни и те же предубеждения в каждом вопросе, или данные регулярных измерений чего бы то ни было, для чего характерна инерция, — в таких случаях мы наблюдаем одно-единственное событие, а не странную их цепь, и перемножать вероятности нельзя. Например, если на протяжении 12 месяцев после установки в городе табличек «Соседского дозора» преступность держалась на уровне ниже среднего, было бы ошибкой думать, что этой удачной полосой мы обязаны табличкам, а не случайности. Уровень преступности меняется медленно, характеристики одного месяца плавно перетекают в другой, и ситуация больше напоминает однократное подбрасывание монеты, чем последовательность из двенадцати таких подбрасываний.
Неверное применение формулы вероятности конъюнкции в правосудии чревато не просто математическими ошибками, но и несправедливыми приговорами. Печально известен пример высосанного из пальца «закона Мидоу», названного в честь британского педиатра, который заявил: расследуя случаи синдрома внезапной детский смертности, нужно считать, что «один случай в семье — трагедия, два — подозрительное совпадение, а три — убийство, если не доказано обратное». В 1999 г., выступая в качестве эксперта в деле юриста Салли Кларк, потерявшей двоих новорожденных сыновей одного за другим, этот врач утверждал, что вероятность одной внезапной младенческой смерти в благополучной некурящей семье составляет 1 к 8500, а двух смертей — 1 к 8500 в квадрате, то есть 1 к 72 миллионам. Кларк приговорили в пожизненному заключению за убийство. Возмущенные статистики указали на ошибку: случаи младенческой смертности в одной семье не являются независимыми событиями, потому что у братьев может быть одна и та же генетически обусловленная предрасположенность, в доме, где живет семья, могут присутствовать некие факторы высокого риска, а родители могут отреагировать на первую трагедию излишними предосторожностями, которые только повысят вероятность второй. Через несколько лет Кларк выпустили после второго обжалования приговора (на других основаниях), а в последующие годы судам пришлось пересмотреть сотни дел, содержавших ту же ошибку[191].
Еще один пример ошибки при вычислении конъюнкции — сумасбродная попытка Дональда Трампа и его сторонников оспорить результаты выборов 2020 г., основанная на беспочвенных заявлениях о фальсификации результатов. В заявлении, поданном в Верховный суд США, генеральный прокурор Техаса Кен Пакстон писал:
Вероятность, что экс-вице-президент Байден победит на прямых выборах в любом из четырех штатов — Джорджии, Мичигане, Пенсильвании и Висконсине — по отдельности, учитывая, что первоначально, по состоянию на 3 часа утра 4 ноября 2020 г., президент Трамп опережал Байдена в этих штатах, меньше, чем один на квадрильон, или 1 к 1 000 000 000 000 000. Шансы экс-вице-президента Байдена победить сразу во всех четырех штатах составляют менее одного на квадрильон в четвертой степени.
Удивительная математика Пакстона предполагает, что голоса, накапливающиеся по ходу подсчета, статистически независимы, словно ряд бросков игральной кости. Но горожане голосуют не так, как жители пригородов, которые, в свою очередь, голосуют не так, как сельские жители, а избиратели, голосовавшие лично, голосуют не так, как те, кто голосовал по почте (особенно на выборах 2020 г., когда Трамп громогласно призывал своих сторонников не голосовать по почте). Решения избирателей каждой из этих групп не являются независимыми, а базовые оценки отличаются от группы к группе. Кроме того, так как результаты по избирательным участкам обнародуют сразу по окончании подсчета, а голоса, поданные по почте, прибавляются к ним позже, по мере поступления данных, промежуточная сумма голосов в пользу каждого из кандидатов то растет, то падает, и экстраполировать окончательные итоги на основании промежуточных не представляется возможным. Абсурдность обвинений достигла четвертой степени, когда Пакстон перемножил выдуманные вероятности по каждому из четырех штатов, итоги выборов в которых также не являются независимыми: то, что влияло на мнение избирателей Мичигана, влияло, скорее всего, и на избирателей Висконсина[192].
Статистическая независимость связана с понятием причинности: если одно событие влияет на другое, они не являются статистически независимыми (хотя, как мы еще увидим, обратное неверно: события, не связанные отношениями причины и следствия, могут оказаться зависимыми статистически). Вот почему ошибка игрока — это ошибка. Одно вращение колеса рулетки никак не влияет на другое, поэтому азартный человек, рассчитывающий, что череда «черного» вымостит дорожку «красному», проиграется до нитки: вероятность выпадения «красного» всегда чуть меньше 0,5 (потому что есть еще зеленые ячейки 0 и 00). Заметьте, что ошибаться относительно статистической независимости можно и так и эдак: можно ошибочно предполагать как независимость (закон Мидоу), так и зависимость событий (ошибка игрока).
Зависят события друг от друга или нет, очевидно не всегда. Одна из известнейших попыток приложить науку о когнитивных искажениях к решению житейских загадок — анализ феномена «горячей руки» в баскетболе, произведенный Тверски в сотрудничестве с социальным психологом Томасом Гиловичем[193]. Любому болельщику известно, что время от времени баскетболист может быть «в ударе», «на кураже» или «на драйве»; тут сразу вспоминается «серийный бомбардир» Винни Джонсон, который в 1980-е гг. играл на позиции атакующего защитника в Detroit Pistons и заслужил прозвище «Микроволновка», потому что умел молниеносно «разогреть» атаку. Вопреки мнению болельщиков, тренеров, игроков и спортивных журналистов, Тверски и Гилович пришли к выводу, что «горячая рука» — иллюзия, своего рода ошибка игрока. Проанализированные ими данные свидетельствовали, что результат каждого броска статистически независим от предшествующей череды попыток забросить мяч в кольцо.
Однако, не изучив данные, неверно отрицать реальность феномена «горячей руки» по примеру ошибки игрока просто из-за отсутствия причинно-следственной связи. В отличие от колеса рулетки, тело и мозг спортсмена обладают памятью, и думать, что всплеск энергии или уверенности в себе может длиться несколько минут подряд, — отнюдь не суеверие. Так что другие статистики не нанесли удара по научному мировоззрению, когда покопались в данных еще раз и пришли к выводу, что светила науки ошиблись, а фанаты были правы: феномен «горячей руки» в баскетболе
Ошибка ошибки «горячей руки» преподает нам три урока. Во-первых, события могут быть статистически зависимыми не только если одно из них является причиной другого, но и если оно влияет на то, какое событие выбирается для сравнения. Во-вторых, ошибка игрока может возникать благодаря отчасти рациональному свойству восприятия: когда мы ищем цепочки идентичных исходов в длинном ряду событий, череда определенной длины действительно с большей вероятностью прервется, чем продолжится. В-третьих, вероятность действительно бывает глубоко неинтуитивна: даже знатоки способны наделать ошибок в вычислениях.
Теперь давайте рассмотрим вероятность
Формула вероятности разделительного высказывания подсказывает, где ошибся телеметеоролог, заявивший, что в выходные обязательно прольется дождь, потому что и в субботу, и в воскресенье вероятность дождя составляет 50 %: сложив две вероятности, он дважды посчитал все те выходные, в которые дождь будет идти
Вероятность
Предположим, например, что каждый год характеризуется 10 %-ной вероятностью начала войны. Каковы шансы, что на протяжении десяти лет разразится хотя бы одна война? (Давайте примем, что войны — независимые, а не контагиозные события, какими они, похоже, являются.)[195] Вместо того чтобы прибавлять к вероятности войны в год № 1 вероятность войны в год № 2 и вычитать из этой суммы вероятность того, что война начнется и в год № 1, и в год № 2 и так далее для всех возможных комбинаций, мы можем просто вычислить шансы, что никакой войны за десять лет не вспыхнет, и вычесть их из единицы. Вероятность десяти мирных лет равна вероятности, что война не начнется в каждый отдельный год из этих десяти, а именно 0,9, умноженному само на себя десять раз (0,9 × 0,9 × …0,9, или 0,910, что равно 0,35). Вычтя 0,35 из единицы, получаем 0,65.
И наконец, мы добрались до
Хотя расчет условной вероятности прост, интуитивно его не ухватишь, пока не представишь себе ситуацию и не конкретизируешь ее (как всегда). Взгляните на диаграммы Венна, где площадь областей на листе соотносится с числом исходов. Прямоугольник, площадь которого принимается за единицу, соответствует всей совокупности возможных исходов. Круг А заключает в себе все события А, и на рисунке слева вверху видно, что вероятность А равна соотношению площади круга А (выделенного темным цветом) к площади светло-серого прямоугольника — другими словами, числу случившихся событий, деленному на число его возможностей случиться. Рисунок справа вверху иллюстрирует вероятность (А
Рисунок, помещенный внизу справа, раскрывает смысл понятия условной вероятности. Здесь видно, что при таком расчете мы должны игнорировать пространство всех теоретически возможных исходов (белого цвета) и сосредоточить внимание только на исходах, когда случилось В, то есть на светло-сером круге B. Давайте попробуем вычислить, какую долю
Вот пример: у Греев двое детей. Старшая — девочка. Какова при этом вероятность, что дочек у Греев две? Давайте переведем вопрос в термины условной вероятности, то есть вероятности, что первый ребенок — девочка и второй ребенок — девочка, при условии, что первый ребенок — девочка. Это можно записать так: Р (1-й = девочка
Условная вероятность помогает уточнить понятие статистической независимости, объяснение которого я не довел до конца. Теперь мы можем дать такое определение: А и В независимы, если для всех В вероятность А при условии В равна вероятности А (и то же самое верно для В). Помните ошибку перемножения вероятностей при вычислении конъюнкции зависимых событий? Хотите узнать правильное решение? Легко: вероятность конъюнкции P(А