
Полная версия:
Как не ошибаться. Сила математического мышления
С педагогической точки зрения, трудно защищать поведение Коши. Тем не менее я с пониманием отношусь к его позиции. Одна из величайших радостей математики – неоспоримое ощущение, что ты поймал правильную мысль и докопался до самого ее основания. Такого чувства я не испытывал ни на одном другом уровне своей психической деятельности. А когда вы знаете, как делать что-то правильно, трудно (а для некоторых упрямцев просто невозможно) заставить себя объяснить это неверным способом.
Глава третья. Поголовное ожирение
Комический актер Евгений Мирман часто рассказывает историю, имеющую прямое отношение к статистике. По его словам, он любит повторять на своих выступлениях одну фразу: «Я читал, что сто процентов американцев – азиаты». Какой-нибудь озадаченный зритель обязательно возразит: «Но Юджин, вы же не азиат». В ответе артиста и содержится вся соль шутки: «Но я читал, что я азиат!»
Я вспомнил эту реплику Мирмана, когда натолкнулся в журнале Obesity на статью, в заголовке которой был поставлен весьма неприятный вопрос: «Будут ли все американцы страдать избыточным весом и ожирением?»[79] Как будто одной постановки вопроса было недостаточно, в статье дается ответ: «Да – к 2048 году».
Ровно в 2048 году мне стукнет семьдесят семь, и хотелось бы верить, что в столь почтенном возрасте я все-таки останусь при своем весе и не буду страдать ожирением. Но я читал, что буду!
Статья в журнале Obesity вызвала широкие дискуссии в прессе. В новостях предупреждали о наступлении «ожирения как катастрофы современности»[80]. В Long Beach Press-Telegram была опубликована статья с простым заголовком: We’re Getting Fatter («Мы становимся все более толстыми»)[81]. Результаты исследования, проведенного автором этой статьи, перекликались с последним проявлением лихорадочной, постоянно меняющейся озабоченности американцев по поводу морального статуса нашей страны. Еще до моего рождения парни отращивали длинные волосы, а значит, мы были обречены на то, что коммунисты одержат над нами верх. Когда я был ребенком, мы слишком много играли в аркадные игры[82], что обрекало нас на проигрыш в конкурентной борьбе с трудолюбивыми японцами. Сейчас мы едим слишком много фастфуда, поэтому умрем слабыми и неспособными к самостоятельному передвижению, в окружении пустых пакетов от курятины, запихнутых под диваны, с которых мы уже давно не в состоянии подняться. В статье эта озабоченность была представлена в качестве научно доказанного факта.
Спешу вас обрадовать. Не все из нас в 2048 году будут страдать ожирением[83]. Почему? Потому что не все линии прямые.
Тем не менее, как мы узнали от Ньютона, каждая линия достаточно близка к прямой. Эта идея лежит в основе линейной регрессии – статистического метода, имеющего для социологии то же значение, что и отвертка при ремонте дома. Это инструмент, которым вы почти наверняка воспользуетесь, какая бы задача перед вами ни стояла. Каждый раз, когда вы читаете в газете, что: люди, у которых много двоюродных братьев и сестер, чувствуют себя более счастливыми; граждане стран, где шире представлена сеть экспресс-кафе «Бургер Кинг», больше придерживаются свободной морали; сокращение приема ниацина повышает риск дерматофитоза в два раза; каждые 10 тысяч долларов дохода на 3 % повышают вероятность, что вы проголосуете за республиканцев, – во всех этих случаях вы имеете дело с результатом, полученным методом линейной регрессии[84].
Вот как это работает. Вы хотите установить взаимозависимость между двумя параметрами, скажем между стоимостью обучения в университете и средним баллом по отборочному тесту SAT принятых на учебу студентов. Возможно, вы считаете: чем выше средний балл SAT, тем дороже учебное заведение, – но посмотрите на данные, которые говорят, что это далеко не универсальный закон. В Университете Элона, расположенном на окраинах Берлингтона (штат Северная Каролина), средний совокупный результат по математике и английскому языку составляет 1217 баллов; при этом университет взимает плату за обучение в размере 20 441 доллара в год. Обучение в Колледже Гилфорда, расположенном рядом, в городе Гринсборо, обходится немного дороже – 23 420 долларов, но средний результат первокурсников по SAT составляет там всего 1131 балл.
Вместе с тем, если вы посмотрите на весь список учебных заведений Северной Каролины – тридцать один частный университет, данные об оплате за обучение и о среднем балле которых были представлены в 2007 году в «Сети ресурсов для построения карьеры штата Северная Каролина», – вы увидите четкую тенденцию[85].
На представленном ниже рисунке каждая точка графика соответствует одному из колледжей. Вы видите те две точки, которые находятся в правом верхнем углу, с высоким средним баллом SAT и столь же высокой платой за обучение? Это Университет Уэйк Форест и Университет Дэвидсона. Одинокая точка в нижней части рисунка соответствует единственному частному учебному заведению в этом списке, плата за обучение в котором меньше 10 тысяч долларов, – Колледжу медицинских наук Кабаррус.

Данный рисунок четко показывает, что в учебных заведениях с более высоким средним баллом SAT цена за обучение, как правило, выше. Но насколько выше? Именно здесь на сцену выходит линейная регрессия. Очевидно, что точки на рисунке не образуют прямую линию, но видно, что они находятся не так уж далеко от прямой. Пожалуй, можно было бы вручную нарисовать прямую линию, проходящую посередине этого облака точек. Линейная регрессия исключает угадывание и позволяет найти прямую линию, максимально приближенную ко всем точкам[86]. В случае университетов штата Северная Каролина эта прямая выглядит так, как на следующем рисунке.

Коэффициент наклона изображенной на рисунке прямой равен 28. Это означает следующее: если плата за обучение зависела бы только от баллов SAT, которые задает прямая на графике, тогда на каждый балл SAT приходилось бы дополнительных 28 долларов платы за обучение. Если вам удалось бы поднять средний балл первокурсников на 50 пунктов, тогда вы могли бы назначить более высокую плату за обучение – на 1400 долларов. (Или, с точки зрения родителей, если ваш ребенок на 100 баллов улучшит свой результат отборочного теста, это обойдется вам в дополнительных 2800 долларов в год. Курс по подготовке к тесту оказался более дорогим, чем вы думали!)
Линейная регрессия представляет собой замечательный инструмент: гибкий, масштабируемый и легкий в применении (вы просто нажимаете соответствующую кнопку электронной таблицы). Этот инструмент можно применять к двум наборам данных с участием двух переменных, как в приведенном выше примере, но он работает не менее эффективно и в случае трех или даже тысячи переменных. Каждый раз, когда вам нужно понять, как одни переменные меняют другие переменные и в каком направлении, линейная регрессия – это первое, что следует использовать. Этот инструмент применим буквально к любому набору данных.
Однако в этом заключается не только сильная, но и слабая сторона линейной регрессии. Вы можете применить этот метод, не задумываясь, действительно ли феномен, который вы пытаетесь моделировать, близок к линейному. Но вы не должны так делать. Я сказал, что линейная регрессия подобна отвертке – что действительно так; однако в другом смысле она скорее напоминает циркулярную пилу. Если вы примените этот инструмент без тщательного анализа того, что вы делаете, результаты могут оказаться плачевными.
Возьмем в качестве примера ракету, которую мы с вами запустили в предыдущей главе. Возможно, вы не имеете никакого отношения к ее запуску. А может быть, напротив, представляете собой ту цель, на которую эта ракета направлена. В последнем случае вы особенно заинтересованы в как можно более точном анализе траектории движения ракеты.
Вы могли бы нанести на график положение ракеты по вертикали в пяти точках по времени. Такой график выглядит следующим образом.

Теперь вы в состоянии быстро выполнить линейную регрессию, получив замечательный результат: линию, которая проходит почти через все точки на графике.

(В этот момент ваша рука начинает приближаться к острому полотнищу циркулярной пилы.)
Построенная вами линия представляет собой весьма точную модель движения ракеты: за каждую минуту ракета поднимается на определенное фиксированное расстояние, скажем на 400 метров. Через час ракета окажется в 24 километрах над поверхностью земли. Когда же она опустится на поверхность? Никогда! Направленная вверх наклонная прямая линия по-прежнему стремится вверх. Именно так ведут себя прямые.
(Кровь, травмы, вопли.)
Однако не каждая линия является прямой. А траектория полета ракеты несомненно представляет собой не прямую, а параболу. Подобно окружности Архимеда, вблизи она действительно похожа на прямую, поэтому линейная регрессия сослужит вам большую службу, позволив определить местоположение ракеты через пять секунд после запуска. Но через час? Даже не думайте об этом. Ваша модель говорит о том, что через час ракета находится в нижних слоях стратосферы, хотя на самом деле она, возможно, уже приближается к вашему дому.
Возможно, самое образное предостережение в отношении бездумной линейной экстраполяции сформулировал не статистик, а Марк Твен в романе Life on the Mississippi («Жизнь на Миссисипи»):
…Длина Миссисипи между Каиром и Новым Орлеаном сто семьдесят шесть лет тому назад была тысяча двести пятнадцать миль. После прорыва русла в 1722 году длина стала тысяча сто восемьдесят миль. Когда образовался рукав у Американской излучины, длина стала тысяча сорок миль. С тех пор этот участок реки укоротился еще на шестьдесят семь миль. Следовательно, сейчас ее длина между Каиром и Новым Орлеаном всего девятьсот семьдесят три мили.
…За сто семьдесят шесть лет Нижняя Миссисипи укоротилась на двести сорок две мили, то есть в среднем примерно на милю и одну треть в год. Отсюда всякий спокойно рассуждающий человек, если только он не слепой и не совсем идиот, сможет усмотреть, что в древнюю силурийскую эпоху, – а ей в ноябре будущего года минет ровно миллион лет – Нижняя Миссисипи имела свыше миллиона трехсот тысяч миль в длину и висела над Мексиканским заливом наподобие удочки. Исходя из тех же данных, каждый легко поймет, что через семьсот сорок два года Нижняя Миссисипи будет иметь только одну и три четверти мили в длину, а улицы Каира и Нового Орлеана сольются, и будут эти два города жить да поживать, управляемые одним мэром и выбирая общий городской совет. Все-таки в науке есть что-то захватывающее. Вложишь какое-то пустяковое количество фактов, а берешь колоссальный дивиденд в виде умозаключений. Да еще с процентами[87].
Ремарка в сторону: как получить зачетные баллы на моем экзамене по математическому анализу
Методы математического анализа во многом похожи на линейную регрессию: они носят сугубо механический характер, с ними вполне может справиться ваш калькулятор, а невнимательное применение этих методов сопряжено с большими опасностями. На экзамене по матану вам могут предложить рассчитать вес воды, оставшейся в кувшине после того, как вы проделаете в нем отверстие и позволите воде вытекать определенным потоком на протяжении определенного промежутка времени, и тому подобное. Решая задачу такого рода в условиях нехватки времени, вполне можно сделать арифметические ошибки. Порой это приводит к тому, что тот или иной студент получает нелепый результат, например что вес воды в кувшине составляет −4 грамма.
Если студент получает результат «−4 грамма» и в отчаянии торопливо пишет «Я где-то напортачил, но не могу найти ошибку», я даю такому студенту половину зачетных баллов за экзамен.
Если же студент просто пишет «−4 грамма» в конце страницы и обводит этот результат кружком, он получает ноль зачетных баллов – даже если вся процедура вывода этого результата была правильной, за исключением того, что где-то посередине страницы единственная цифра оказалась не на своем месте.
Вычисление интеграла или выполнение линейной регрессии – это задачи, которые достаточно эффективно может решать компьютер. Понимание того, имеет ли полученный результат смысл (или принятие решения, стоит ли вообще применять соответствующий метод в данном случае), требует направляющей человеческой руки. Когда мы преподаем математику, предполагается, что нужно объяснить учащимся, как стать таким проводником. Курс математики, который не делает этого, по существу учит студента выполнять функции дефектной версии Microsoft Excel.
Будем откровенны: именно это и происходит на большинстве наших математических курсов. Сокращенная история споров (сама представляющая собой предмет споров) состоит в том, что преподавание математики детям вот уже несколько десятилетий является ареной так называемых математических войн. По одну сторону этого противостояния находятся учителя, которые предпочитают делать акцент на запоминании, беглости, традиционных алгоритмах и точных ответах, а по другую сторону – учителя, считающие, что в основе преподавания математики должно лежать выяснение смысла, развитие способов мышления, обучение методом направляемых открытий и аппроксимация. Первый подход называют порой традиционным, а второй – реформистским, хотя предположительно нетрадиционный подход к обучению посредством открытий используется в той или иной форме вот уже десятки лет, а действительно ли так называемые реформы можно считать реформами – это и есть предмет споров. Споров весьма ожесточенных. Во время званого математического ужина вполне прилично обсуждать политические или религиозные вопросы, но начните спорить о математической педагогике – и это грозит закончиться тем, что кто-то из сторонников либо традиционного, либо реформистского подхода обидится и хлопнет дверью.
Я не причисляю себя ни к одному из этих лагерей. Мне не по пути с теми реформистами, которые хотят отказаться от заучивания таблицы умножения наизусть. В процессе серьезных математических размышлений вам неизбежно понадобится умножить 6 на 8, но, если каждый раз для этого доставать калькулятор, вам не удастся достичь того состояния интеллектуальной спонтанности, которая требуется для процесса размышлений. Нельзя написать сонет, выискивая в словаре значение каждого слова.
Некоторые сторонники реформистского подхода заявляют, что классические алгоритмы (например, «сложить два двузначных числа, расположив одно над другим столбиком и в случае необходимости выполнив перенос») следует исключить из учебного курса, чтобы они не мешали ученикам самостоятельно обнаруживать свойства математических объектов[88].
С одной стороны, я считаю эту мысль ужасной: такие алгоритмы представляют собой полезные инструменты, над разработкой которых кто-то упорно работал, и нет никаких оснований начинать все с нуля.
С другой стороны, мне кажется, что в современном мире вполне можно отказаться от некоторых алгоритмов. Например, нам нет необходимости учить студентов извлекать квадратные корни вручную или в уме (хотя второй из этих двух навыков, говорю вам по собственному опыту, можно использовать в качестве замечательного фокуса на вечеринке в кругу яйцеголовых). Калькулятор – не менее полезный инструмент, над созданием которого кто-то упорно трудился; мы также должны использовать этот инструмент, когда того требует ситуация! Меня даже не интересует, могут ли мои студенты разделить 430 на 12 посредством деления столбиком. Меня на самом деле
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
Сноски
1
Russell Bertrand. The Study of Mathematics // Mysticism and Logic: And Other Essays. Longman, 1919. P. 60. Прим. М. Г.
Здесь и далее все постраничные сноски даются в квадратных скобках. Примечания, написанные научным редактором, даны с пометой М. Г.; примечания, сделанные редактором, – с пометой ред.; авторские примечания – без какой-либо пометы.
2
В объяснении правил судоку в английской версии газеты Metro, в частности, сказано: «Хотя это игра с числами, она не требует математических навыков – только понимания логики и терпения». Прим. М. Г.
3
Биографические материалы об Абрахаме Вальде взяты из работы: Oscar Morgenstern. Abraham Wald, 1902–1950 // Econometrica, 1951, Oct., 19, no 4, p. 361–367.
4
Исторические данные о SRG взяты главным образом из следующего источника: W. Allen Wallis. The Statistical Research Group, 1942–1945 // Journal of the American Statistical Association, 1980, June, 75, no 370, p. 320–330.
5
Отец Пола [Пол Вулфовиц – американский политик, президент Всемирного банка (2005–2007). Прим. М. Г.].
6
W. Allen Wallis. The Statistical Research Group…, p. 322.
7
W. Allen Wallis. The Statistical Research Group…, p. 322.
8
Сэвидж был почти слепым и видел только уголком одного глаза. Как-то, чтобы доказать какую-то свою идею об освоении Арктики, он целых полгода питался одним пеммиканом [мясной концентрат; пища индейцев Северной Америки и основной мясной продукт в арктических и антарктических экспедициях начала XX века. Прим. М. Г.]. Просто подумал, что об этом стоит упомянуть.
9
W. Allen Wallis. The Statistical Research Group…, p. 329.
10
Я узнал о Вальде и проблеме крепкой авиационной брони из книги Говарда Вейнера: Howard Wainer. Uneducated Guesses: Using Evidence to Uncover Misguided Education Policies. NJ: Princeton University Press, 2011. Автор использует идеи Вальда для анализа таких же сложных и неполных статистических данных, полученных в ходе изучения сферы образования.
11
См.:Marc Mangel, Francisco J. Samaniego. Abraham Wald’s Work on Aircraft Survivability // Journal of the American Statistical Association, 1984, June, 79, no. 386, p. 259–267.
12
Отдельный интересный вопрос, как измерять качество питания в процентах. Прим. М. Г.
13
Физик Ричард Фейнман утверждал, что математики не ставят таких вопросов: «…Я всегда выигрывал. Если я угадывал – здорово. Если не угадывал, то всегда мог найти в их упрощении что-то, что они упускали из виду» (Р. Ф. Фейнман. Вы, конечно, шутите, мистер Фейнман! / Пер. с англ. Н. А. Зубченко, О. Л. Тиходеевой, М. Шифмана. М.: НИЦ «Регулярная и хаотическая динамика», 2001. С. 39). Прим. М. Г.
14
См.:Jacob Wolfowitz. Abraham Wald, 1902–1950 // Annals of Mathematical Statistics, 1952, Mar. 23, no. 1, p. 1–13.
15
Например, истории о том, что дельфины выталкивают тонущих людей на берег. На самом деле дельфины поддерживают тонущего на плаву, подталкивая в произвольных направлениях (что естественно для водных млекопитающих), но только выжившие – те, кого подтолкнули к берегу, – смогли рассказать о встрече с ними. Прим. М. Г.
16
Взаимный фонд, или фонд взаимных инвестиций (mutual fund), – портфель акций, отобранных и приобретенных профессиональными финансистами на вложения большого числа мелких вкладчиков. Прим. М. Г.
17
Справедливости ради следует отметить, что сам индекс S&P 500 показал еще более высокий рост – 212,5 % за тот же период.
18
Amy L. Barrett, Brent R. Brodeski. Survivor Bias and Improper Measurement: How the Mutual Fund Industry Inflates Actively Managed Fund Performance (http://www.etf.com/docs/sbiasstudy.pdf).
19
Martin Rohleder, Hendrik Scholz, Marco Wilkens. Survivorship Bias and Mutual Fund Performance: Relevance, Significance, and Methodical Differences // Review of Finance, 2011, vol. 15, no 2, p. 441–474 – см. таблицы. Мы перевели месячную избыточную доходность в годовую избыточную доходность, поэтому цифры в нашем тексте не совпадают с данными, приведенными в статье.
20
Abraham Wald. Method of Estimating Plane Vulnerability Based on Damage of Survivors. Alexandria, VA: Center for Naval Analyses, repr., 1980, July, CRC 432.
21
Железный человек по имени Энтони Эдвард, или Тони Старк, – герой комиксов. Прим. М. Г.
22
Парафраз известной формулировки Карла фон Клаузевица: «Война есть не что иное, как продолжение государственной политики иными средствами» (К. Клаузевиц. О войне / Пер. А. Рачинского. М.: Логос; Наука, б.г. [1998]. С. 27). Прим. ред.
23
Владимир Игоревич Арнольд приводил следующие слова Годфри Харди (в двух вариантах – и оба раза с негодованием): 1) «Общая черта королевы и математики – полная бесполезность обеих» (В. Арнольд. Переориентация науки на «прикладные исследования» приведет к снижению интеллектуального уровня страны // Троицкий вариант – Наука. 2008. № 19. http://trv-science.ru/2008/12/23/18/); 2) «Теория чисел является королевой математики вследствие своей полной бесполезности» (В. Арнольд. Нужна ли в школе математика? Доклад на Всероссийской конференции «Математика и общество. Математическое образование на рубеже веков» в Дубне 21 сентября 2000 года // Скепсис. http://scepsis.net/library/id_649.html). Харди написал это в начале прошлого века. Сейчас всякий раз, когда вы пользуетесь кредитной карточкой, вы (точнее, банк) используете алгоритмы шифрования транзакций, основанные на результатах теории чисел. Прим. М. Г.
24
См.: J. von Neumann. Collected Works. Volume I: Logic, Theory of Sets and Quantum Mechanics. New York; London; Oxford; Paris: Pergamon Press, 1961. Pp. 1–9. [Приведенная далее цитата дается в пер. Ю. А. Данилова, см.: Ю. А. Данилов. Математик фон Нейман и его «Математик» // Природа. 1983. № 2. С. 86–87. Прим. перев.]
25
В настоящее время специалисты называют теорему Ферма теоремой Уайлса, поскольку Эндрю Уайлс доказал ее (не без помощи Ричарда Тейлора), тогда как Ферма не сделал этого. Однако, по всей вероятности, традиционное название неискоренимо и вряд ли будет когда-нибудь вытеснено.
26
Ее доказал Григорий Перельман. Прим. М. Г.
27
Это гипотеза. Прим. М. Г.
28
Что касается гипотезы Римана, мне больше всего нравятся книги: John Derbyshire. Prime Obsession: Bernhard Riemann and the Greatest Unsolved Problem in Mathematics. New York: Plume; Reprint edition, 2004 [Дж. Дербишир. Простая одержимость. Бернхард Риман и величайшая нерешенная проблема в математике. М.: Астрель; Corpus, 2010. –Прим. М. Г.];Marcus du Sautoy. The Music of the Primes: Searching to Solve the Greatest Mystery in Mathematics. New York: Harper Perennial; Reprint edition, 2012. О теореме Гёделя см.:Douglas Hofstadter. Gödel, Escher, Bach: An Eternal Golden Braid. New York: Basic Books, 1999 [Д. Хофштадтер. Гёдель, Эшер, Бах. Эта бесконечная гирлянда. Самара: Бахрах-М, 2001. –Прим. М. Г.]. По правде сказать, теорема Гёделя упоминается в этой книге вскользь, как один из элементов размышлений о самоотносимости в искусстве, музыке и логике.
29
Правда, в двадцать с лишним лет я все-таки потратил какое-то время на нешуточные размышления, не стать ли мне настоящим писателем. Я даже написал и опубликовал вполне глубокомысленное литературное произведение – роман The Grasshopper King («Король кузнечиков»). Но пока я работал над ним, то обнаружил, что по полдня слоняюсь в тоске, мечтая лишь об одном: решать математические задачи.
30
Ю. А. Данилов. Математик фон Нейман и его «Математик». С. 86. Прим. М. Г.