Саманта Клейнберг.

Почему. Руководство по поиску причин и принятию решений



скачать книгу бесплатно

Информация от издательства

Научный редактор Валерий Артюхин

Издано с разрешения O’Reilly Media, Inc.


Все права защищены.

Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.


2017, Mann, Ivanov and Ferber

Authorized Russian translation of the English edition of Why, ISBN 9781491949641

© 2015 Samantha Kleinberg, published by O’Reilly Media, Inc. This translation is published and sold by permission of O’Reilly Media, Inc., which owns or controls all rights to publish and sell the same.

© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2017

Предисловие

Может ли кофе продлить жизнь? От кого вы заразились гриппом? По каким причинам растут цены на акции? Каждый раз, когда вы выбираете подходящую диету, вините кого-то за испорченные выходные или принимаете инвестиционные решения, важно понимать, почему происходят те или иные вещи. Именно знание причинно-следственных связей помогает предсказывать будущее, объяснять прошлое и вмешиваться в ход событий. Зная, что контакт с человеком, больным гриппом, через определенный промежуток времени приводит к заболеванию, вы сможете просчитать, когда почувствуете симптомы болезни. Понимая, что настойчивые и целенаправленные просьбы приведут к увеличению пожертвований на проведение политической кампании, вы заострите на этом внимание как на вероятной причине улучшений в области фандрайзинга[1]1
  Фандрайзинг (англ. fundraising) – привлечение денежных и иных ресурсов (человеческих, материальных, информационных и т. д.), которые организация не может обеспечить самостоятельно и которые необходимы для реализации определенного проекта или деятельности. Прим. ред.


[Закрыть]
. Осознав, что интенсивные физические упражнения вызывают гипогликемию[2]2
  Гипогликемия – патологическое состояние, которое характеризуется низким уровнем содержания глюкозы в крови (ниже 3,3 ммоль/л). Прим. ред.


[Закрыть]
, диабетики, занимающиеся спортом, начинают следить за концентрацией глюкозы в крови.

Но, несмотря на особую важность обозначенного навыка, вряд ли вам доводилось посещать тренинги на тему «Как выявлять причины событий». Скорее всего, вы даже ни разу не задумывались, что породило то или иное явление.

Если говорить обобщенно, причины повышают вероятность определенных событий; они делают возможными соответствующие следствия. И все же то, что некое лекарство может вызвать сердечный приступ, не означает, что именно оно виновато в кардиозаболевании определенного человека, а то, что в одной школе сокращение числа учащихся в классе обеспечило лучшие показатели на экзаменах, не означает, что аналогичное вмешательство сработает в других образовательных заведениях.

Цель этой книги не просто рассказать о том, какие воздействия можно применить, когда все идет по плану, но и показать, почему порой так сложно добиться успешных следствий (или кажущихся таковыми).

Мы рассмотрим некоторые практические аспекты, часто игнорирующиеся в теоретических дискуссиях. Существует множество точек зрения о причинности (одни дополняют друг друга, а другие соперничают), и сама она затрагивает разнообразные отрасли знания: среди прочего, философию, информатику, психологию, экономику и медицину. Не вставая в дебатах ни на одну из сторон, хочу лишь дать читателям представление об обширном диапазоне мнений и максимально ясно показать, где консенсус можно считать достигнутым, а где до него далеко. Мы исследуем также психологию каузальности[3]3
  Каузальный (от лат. causa – «причина») – причинный, обусловленный, причинно-следственный. Прим. ред.


[Закрыть]
(как люди научаются знанию причин), рассмотрим эксперименты по установлению причинно-следственных связей (и пределов возможного) и узнаем, как положить знание каузальной зависимости в основу разработки плана действий (к примеру, нужно ли сокращать количество соли в еде, чтобы избежать повышенного давления).

Прежде всего, установим, что такое причины и почему мы часто ошибаемся в их определении (глава 1, глава 2, глава 3), а потом посмотрим, почему вопрос «когда» так же важен, как и «почему», если речь идет о восприятии и использовании причин (глава 4), и выясним, как учиться видеть причины, руководствуясь только наблюдением (глава 5).

Наличие обширных баз данных дало возможность не просто проверить наши гипотезы, но и выявить причины. Важно, однако, отдавать себе отчет, что далеко не все сведения пригодны для формулирования выводов о каузальных зависимостях. В главе 6 мы увидим, как свойства данных влияют на возможные логические умозаключения, а в главе 7 узнаем, как преодолеть некоторые препятствия с помощью эксперимента, понимая под ним как сложные клинические испытания, так и простой выбор между планами спортивных занятий на бытовом уровне.

Различие между тем, что происходит «как правило», и тем, что бывает «в отдельном случае», и есть та проблема, для решения которой необходимы специализированные стратегии объяснения событий (это тема главы 8). Но использование причин для эффективного вмешательства (например, указание в меню сведений о калорийности блюд для профилактики ожирения) требует расширенного пула данных, а многие воздействия могут вызвать незапланированные последствия (как мы увидим в главе 9). Эта книга поможет вам осознать, почему поиски причинных зависимостей так трудны (а также имеют гораздо больше нюансов и намного более сложны, чем заставляют думать новостные СМИ) и почему, несмотря на всю сложность, эта задача настолько важна и имеет широкое прикладное значение.

Да, трудностей не миновать; но вы также увидите, что надежда на их преодоление остается. Вы получите набор инструментов: вопросы, которые следует задавать; «красные флажки», которые должны вызвать ваше подозрение; способы повышения достоверности каузальных утверждений. Вы научитесь не только определять причины, но и использовать их на практике.

Для чтения этой книги не нужны специальные знания, она для всех. От вас требуется лишь интерес к вопросам причинности. Моя цель – обеспечить всем желающим самый широкий доступ на пересеченную местность под названием «причинные зависимости».

В финале книги мы сосредоточимся на интуитивном подходе: как прийти к пониманию причинно-следственных связей, не прибегая к математическому аппарату (на самом деле математики не будет совсем). Если вы обладатель докторской степени по информационным технологиям или статистике, сможете найти для себя кое-какие новые инструменты и взглянуть на проблему под углом зрения сопряженных наук, а заодно пополните научный багаж методологическими инструментами. Но все же наш путь будет проходить под знаменем, на котором начертано: «Знания о причинности – для всех!»

1. Начало. Где коренятся представления о причинных зависимостях и методах их выявления

В 1999 году британский солиситор[4]4
  Солиситор – категория адвокатов в Великобритании, ведущих подготовку судебных материалов для ведения дел барристерами – адвокатами высшего ранга. Прим. ред.


[Закрыть]
Салли Кларк предстала перед судом по обвинению в убийстве двух своих детей. Первый сын умер внезапно в возрасте 11 недель в декабре 1996 года. Тогда это сочли смертью от естественных причин, но всего через год скончался и второй ребенок: ему было 8 недель. В обоих случаях дети казались в целом здоровыми, поэтому их внезапная гибель вызвала подозрения.

Обстоятельства были очень схожими: малыши умерли примерно в одинаковом возрасте, именно Салли Кларк обнаружила их бездыханными, дома с ними находилась она одна, и оба ребенка, согласно патологоанатомическому исследованию, имели травмы.

Изначально повреждения на теле первого мальчика объяснялись попытками проведения реанимации, но после гибели второго данные были пересмотрены, и ситуация показалась подозрительной. Через месяц после второй смерти обоих родителей арестовали, а позднее Салли Кларк обвинили в убийстве и вынесли приговор.

Какова вероятность того, что двое детей из одной семьи умерли от синдрома внезапной детской смерти (СВДС)? По мнению английских обвинителей, это событие настолько невероятно, что два подобных исхода могли быть только результатом убийства. Этот аргумент (одна из причин в такой степени невероятна, что могла иметь место только другая) и привел к событию, ставшему одним из знаменитых примеров несправедливого приговора. И это ярчайший образец того, к каким последствиям приводит неверное применение статистики и игнорирование причинных зависимостей.

Главная из причин, по которой этот случай получил широкую известность среди статистиков и исследователей вопросов каузальности, заключается в аргументе обвинения. Он был основан, по сути, на следующем: объяснение защиты слишком невероятно, чтобы быть правдой. В качестве эксперта сторона обвинения привлекла доктора Роя Мидоу, который заявил, что вероятность двух летальных исходов от СВДС (или, как говорят в Великобритании, «смертей в колыбели») в одной семье равна 1: 73 000 000. Далее обвинители утверждали: эта вероятность столь ничтожна, что гибель детей никак не может проистекать от естественных причин, а следовательно, должна быть только результатом убийства.

Такая статистика совершенно неверна. Но, даже если бы она оказалась справедливой, все равно ее нельзя использовать так, как это было сделано.

Мидоу базировал свой вывод на научном докладе, в котором шансы СВДС оценивались как 1: 8543, а потом заявил, что вероятность двух смертей равна 1: 8543 ? 8543, то есть примерно 1: 73 000 000[5]5
  Статистические сведения, использованные Мидоу, можно найти в Fleming et al. (2000). Комментарии Мидоу относительно его использования этой статистики см. Meadow (2002).


[Закрыть]
.

Но эти вычисления ложны, потому что заключение опиралось на предпосылку о независимости двух событий, ставших предметом судебного разбирательства.

Когда вы бросаете монетку, то шанс выпадения «орла» не влияет на то, как монетка упадет в следующий раз. Поскольку вероятность каждого исхода всегда равна одной второй, математически корректно перемножить оба числа, если мы желаем узнать вероятность выпадения двух «орлов» подряд.

Именно это и сделал Мидоу.

Причины СВДС точно неизвестны, однако среди факторов риска указываются и окружающие условия: к примеру, курят ли родители, употребляют ли алкоголь. Это означает, что, если в семье был один случай СВДС, другой может произойти с вероятностью намного большей, чем 1: 8543, поскольку у детей общая генетика и одинаковые условия жизни. То есть первая смерть дает сведения о вероятности второй.

Представленный случай, таким образом, можно сравнить с шансами киноактера на получение второго «Оскара». Ведь награды присуждаются не случайным образом: скорее, те же свойства (талант, известность, связи), что обеспечили кому-то первую из них, повышают вероятность получения второй.

В этом и коренилась проблема дела Кларк. Поскольку оба события не были независимыми и, напротив, для обоих могла иметься общая причина, неверно рассчитывать вероятность простым умножением. Вместо этого, анализируя шанс второй смерти, следовало принять во внимание факт первой, а значит, определить допустимость СВДС в семье, где уже произошла подобная трагедия. Показатель вероятности и то, как его использовали, были столь явно и в высшей степени ошибочны, что при рассмотрении первой апелляции защита вызвала в качестве свидетеля профессионального статистика, а Королевское статистическое общество прислало письмо с выражением своих сомнений[6]6
  Мидоу, использовавший эти цифры в свидетельских показаниях, был признан виновным в нарушении профессиональной этики и вычеркнут из медицинских списков, лишившись возможности практиковать (позже апелляционная комиссия восстановила его в правах).


[Закрыть]
.

Неверные расчеты, однако, оказались не единственной проблемой, связанной с причинностью. Обвинители попытались поставить знак равенства между вероятностью некоего события (а именно двух СВДС) в 1: 73 000 000 и возможностью того, что Салли Кларк невиновна. Подобного рода ошибочное рассуждение, когда шанс события приравнивается к вероятности вины или невиновности, известно как «заблуждение прокурора»[7]7
  См. Thompson and Schumann (1987). Еще один известный пример – дело Люсии де Берк, голландской медсестры, которая, как и Кларк, была несправедливо обвинена, но позднее оправдана. Де Берк обслуживала ряд пациентов, которые неожиданно скончались, и эксперт-свидетель рассчитал, что вероятность случайного смертельного исхода составляла 1: 342 000 000. Подробнее о деле Люсии де Берк см. Buchana (2007). Как и в деле Кларк, эта цифра равнялась шансам на невиновность де Берк, при этом обвинение утверждало: вероятность столь ничтожна, что наверняка должна быть ложной.


[Закрыть]
.

Но мы уже знаем, что невероятные события случаются. Возможность двух смертей от СВДС мала, однако шанс того, что два ребенка в одной семье умрут младенцами, также крайне невысок. Значит, нужно не просто решать, принять СВДС в качестве объяснения или нет, а провести сравнение с другим доступным толкованием.

Таким образом, нужно было сравнивать вероятности убийства двоих детей в одной семье (а именно такова была версия обвинения) и того, что оба ребенка одних родителей подвержены СВДС (а обстоятельства дела позволяют это предположить).

Вероятность смерти от СВДС двоих детей из одной семьи не равна шансу того, что эти конкретные малыши страдали таким заболеванием. В деле есть и другие факты, включая физические доказательства, наличие мотива преступления и так далее. Их следовало учитывать наравне с вероятностными данными (например, допустимость убийства при отсутствии мотива, возможности или орудия преступления наверняка была ниже общего показателя)[8]8
  Следует иметь в виду, что СВДС – не единственная возможная причина смерти младенцев. Действительно, в деле Кларк имелось важное свидетельство о том, что один ребенок имел бактериальную инфекцию, которая могла привести к смерти. Однако это свидетельство не было представлено патологоанатомом (позднее его обвинили в серьезном профессиональном нарушении и лишили права заниматься практикой на три года).


[Закрыть]
.

Наконец, любое маловероятное событие однажды произойдет, если будет совершено достаточно попыток. Некорректно низкая вероятность в деле Кларк (1: 73 000 000) все же более чем в 3 раза выше шанса выиграть в лотерею Mega Millions[9]9
  Mega Millions – популярная американская лотерея, проходящая в 44 штатах, округе Колумбия и на Виргинских островах. Она основана на базе 12 лотерей, проводившихся в США, первый тираж состоялся в 2002 году. Минимальный анонсируемый джекпот Mega Millions – 15 млн долларов, а самый крупный разыгранный суперприз составил 656 млн долларов. Прим. ред.


[Закрыть]
(1: 258 000 000). Допустимость, что вы станете победителем подобной лотереи, очень мала; а как насчет шанса, что кто-то все же выиграет? Он весьма высок. Это значит, что использование только вероятностного метода для определения вины и невиновности гарантированно приводит как минимум к ряду ошибочных приговоров. Суть в том, что для отдельного человека возможность стать участником подобных событий крайне низка, но, учитывая, что в мире живут миллионы семей с двумя детьми, где-то такое событие случается.

В итоге после повторной апелляции в январе 2003 года приговор Кларк был пересмотрен. К тому моменту она провела в тюрьме три года.

* * *

Почему дело Салли Кларк можно считать показательным примером ложного каузального мышления?

Расчет вероятностей чреват неточностями, но самые серьезные ошибки возникают, когда выводы основываются на одной лишь вероятности какого-либо события. Разве вы никогда не произносили чего-то вроде «Уж слишком много совпадений» или «Какова вероятность»? Подобные рассуждения порой обоснованны (в компанию приходит новый работник, и в тот же день со стола исчезает ваш любимый степлер; ясновидящая угадывает, что имя вашей родственницы начинается на «М»; два ключевых свидетеля вспоминают, что подозреваемый был одет в красную фланелевую рубашку). Однако некорректно говорить: некое событие слишком невероятно, чтобы случиться, а значит, единственное разумное объяснение – это причинно-следственная связь. Как мы уже видели, вероятность того, что какое-то событие произойдет с отдельным человеком, может быть низка, однако в принципе данное событие возможно.

Неверные каузальные объяснения, помимо несправедливых приговоров, могут повлечь и иные печальные последствия. Можно впустую потратить время и усилия на разработку лекарства, которое никогда не подействует, или на проведение неэффективной и дорогостоящей публичной политической кампании.

Моя книга – о том, как добиться в этом деле лучшего результата. Истинно научное каузальное мышление означает, что мы должны сомневаться в любых исходных предположениях, исследовать альтернативные объяснения и определять случаи, когда мы просто не можем знать, почему некое событие имело место. Иногда, для того чтобы судить, просто недостает информации (либо сведений нужного сорта), поэтому важнее всего выяснить, установить связь.

Я надеюсь, что отныне вы начнете относиться к услышанным каузальным утверждениям скептически (далее мы обсудим, какие вопросы можно задавать для оценки таких утверждений и какие «красные флажки» выискивать). Мы узнаем, как определять причины, формулировать убедительные доказательства зависимостей и использовать причины как руководство к действиям.

Что такое причина

Отвлекитесь на минутку и попытайтесь определить, что такое причина.

Если вы похожи на студентов моего курса по причинно-следственным связям, то, вероятно, уже придумали добрую половину формулировки до того, как уловили собственные возможные возражения. Скорее всего, в вашем определении встречаются оговорки вроде «чаще всего…», или «…но не в каждом случае», или «только если…». Однако в нем наверняка есть и некоторые определенные характеристики: например, причина вызывает следствие, делает следствие более вероятным, обладает способностью производить следствие, отвечает за наступление следствия. Это – общая идея о том, что было некое событие, которое что-то заставило случиться, чего в противном случае просто не произошло бы.

Хотя данное утверждение верно не для всех случаев, в моей книге термин «причина» в целом означает следующее: причина – это нечто, повышающее вероятность следствия, без чего следствие могло произойти, а могло и не произойти, и способное при должных обстоятельствах это следствие произвести.

Одно из самых ранних определений причины дал Аристотель: в его формулировке эта идея означала попытку ответить на вопрос «почему»[10]10
  Рассуждения Аристотеля о причинности можно найти в Aristotle (1924, 1936). For an introduction to causality in ancient Greece, см. Broadie (2009).


[Закрыть]
. Итак, если мы спрашиваем, почему случилось некое событие, кто-то должен объяснить, как это произошло (при нагревании воды выделяется пар), из чего состоит (водород и кислород, соединяясь, образуют воду), какую форму принимает (стул – это нечто для сидения, сделанное из природного материала и имеющее спинку) или для чего предназначено (задача вакцины – предотвратить болезнь).

И все же, отыскивая причины, мы чаще всего хотим знать, почему произошло одно событие, а не другое.

После Аристотеля наука о причинности прошла несколько промежуточных этапов (к примеру, об этом говорил в своих работах Фома Аквинский[11]11
  Фома Аквинский (ок. 1225–1274) – итальянский философ и теолог, систематизатор ортодоксальной схоластики, учитель церкви, основатель томизма, член ордена доминиканцев. С 1879 года признан наиболее авторитетным католическим религиозным философом, связавшим христианское вероучение с философией Аристотеля. Сформулировал пять доказательств бытия Бога. Прим. ред.


[Закрыть]
), следующий крупный шаг был сделан во время научной революции конца эпохи Ренессанса. Этому периоду принадлежат такие ключевые фигуры, как Галилей, Ньютон, Локк, и немало прочих, однако именно труды Дэвида Юма[12]12
  Дэвид Юм (1711–1776) – шотландский философ, представитель эмпиризма, психологического атомизма, номинализма и скептицизма, агностик, экономист и историк, публицист, один из крупнейших деятелей шотландского Просвещения. Прим. ред.


[Закрыть]
в XVIII столетии заложили фундаментальные основы современной научной мысли в области каузальности и методов отыскания причинных зависимостей[13]13
  Hume (1739, 1748).


[Закрыть]
. Нельзя утверждать, что Юм был прав во всем (или что все согласны с его утверждениями либо хотя бы едины во мнении относительно его постулатов), однако именно он возвел вопрос о причинности в критические рамки.

Рассуждая, как нечто становится причиной, Юм поделил вопрос на две части: «Что такое причина?» и «Как мы можем отыскать причины?» Что еще важнее, вместо поисков неких особых свойств, отличающих причины от не-причин, он свел взаимосвязи к закономерностям их наступления. Иными словами, мы изучаем причинно-следственные взаимосвязи путем регулярного наблюдения паттернов их осуществления и учиться причинности можем только на основе опыта регулярности их осуществления.

Укус москита – необходимый инициатор заболевания малярией, а вот всплеск активности продавцов мороженого весной не есть непременное условие для наступления теплых деньков. И все же с помощью одних только наблюдений мы не увидим разницы между регулярностью наступления события (погода/мороженое) и необходимым его условием (москит/малярия). Лишь при наличии контрпримера (например, наступлению теплой погоды не предшествует увеличение ларьков с мороженым) мы способны убедиться, что мороженщики не есть необходимое условие температурных изменений.

Здесь принимается за данность то, что причина имеет место до, а не после и не одновременно со следствием. Мы поговорим об этом подробнее в главе 4 и приведем примеры одновременных событий, ведущих к одинаковому результату, из курса физики; однако важно отметить и другие случаи, когда причина не предшествует следствию явным образом.

Так, наше наблюдение временного графика событий может не совпадать с фактическим графиком или с причинной зависимостью. Когда ружье стреляет, сначала мы видим вспышку, а потом слышим громкий звук. Можно подумать, что вспышка вызывает звук, поскольку она всегда предшествует последнему, хотя, конечно же, оба этих события вызваны тем, что некто нажал на спусковой крючок. Только обратившись к общей причине двух событий, мы сумеем осознать закономерность.

В других случаях мы не в состоянии пронаблюдать события в момент, когда они на самом деле происходят, а потому они могут казаться одновременными, хотя в действительности одно предшествует другому. Также временные графики могут быть некорректны потому, что данные были получены не одновременно с самим событием, а после него, из воспоминания. Если я спрошу, когда у вас последний раз болела голова, время, которое вы назовете, может отличаться от реального (если только вы не делали заметок или само событие не произошло недавно и свежо в вашей памяти), и очень вероятно, что ваши данные с течением времени будут все менее надежны[14]14
  См. Hripcsak et al. (2009), где подробно рассказывается о взаимозависимости специфичности и неопределенности временных суждений.


[Закрыть]
. И в определении, например, реальности побочных эффектов некоего лекарства одной из самых критичных информационных составляющих становится последовательность событий.

Наконец, одно из необходимых условий, постулированных Юмом, гласит: причина не только должна предшествовать следствию по времени; причина и следствие должны быть близки и граничить как во временном, так и в пространственном отношении.

Достаточно сложно изучать каузальные взаимосвязи, которые обнаруживаются с большой задержкой, или если причина пространственно удалена от следствия. Дело в том, что в отношения между двумя событиями могут вмешиваться иные множественные факторы, которые повлияют на исходный результат.

Представим, что приятельница берет у вас на время кофемашину, возвращает, а через два месяца вы обнаруживаете, что аппарат сломан. Теперь намного сложнее обвинить в этом подругу, чем если бы вы обнаружили ущерб непосредственно в момент возврата (действительно, психологические эксперименты демонстрируют в точности подобный феномен, когда участников просят вывести причинные взаимосвязи на основе наблюдений по прошествии разного времени после события)[15]15
  См., например, Lagnado and Speekenbrink (2010).


[Закрыть]
. Аналогично, если человек стоит в нескольких метрах от книжной полки, когда с нее падает книга, вероятность того, что причиной падения стал именно он, а не тот, кто стоял к полке ближе, будет гораздо меньше. Но, когда кий ударяет по бильярдному шару, последний начинает путешествие по столу немедленно, поэтому здесь взаимосвязь обнаружить намного проще.



скачать книгу бесплатно

страницы: 1 2 3 4