Алекс Пентленд.

Социальная физика. Как Большие данные помогают следить за нами и отбирают у нас частную жизнь



скачать книгу бесплатно

Большие данные

Двигателем социальной физики являются большие данные – общедоступная цифровая информация обо всех аспектах жизни людей, которая не так давно распространилась повсеместно. Социальная физика работает следующим образом: она анализирует повторяющиеся шаблоны в получаемом людьми опыте и в том, как они обмениваются идеями, используя для этого те виртуальные следы, подобные хлебным крошкам из сказки братьев Гримм[10]10
  «Гензель и Гретель».


[Закрыть]
, которые мы оставляем за собой в наших передвижениях по миру, – записи звонков, операции по кредитным картам, GPS-данные о местоположении и др. Эти данные раскрывают историю жизни каждого человека, документируя все типы деятельности, которые он для себя выбирает. И это очень отличается от того, что обычно размещают на Facebook; публикации на Facebook – это те сведения, которые люди считают нужным сообщать друг другу, подогнанные под существующие стандарты. Информация о том, где мы проводим время и какие вещи покупаем, дает гораздо более четкое представление о нас настоящих, чем то, что мы предпочитаем о себе рассказывать[11]11
  Pentland 2012c, 2013.


[Закрыть]
.

Процесс анализа шаблонов, прослеживаемых в этих виртуальных следах, называется «добычей реальности» (reality mining), и благодаря ей мы можем очень многое рассказать о личности отдельных индивидов. Я и мои ученики обнаружили, что с помощью этой информации можно определить, каковы шансы конкретного человека заболеть диабетом или сможет ли он выплатить кредит. Так, анализируя эти шаблоны в жизни разных людей, мы видим, что многие явления – катастрофы, революции, кризисы, – которые раньше казались хаотичными проявлениями «божьей воли», начинают поддаваться объяснению. По этой причине журнал МТИ Technology Review назвал нашу технологию добычи реальности одной из десяти разработок, которые изменят мир (более подробную информацию см. в Приложении 1: Добыча реальности).

Научный метод, используемый в социальной физике, отличается от того, что применяется в большинстве общественных наук, тем, что он главным образом опирается на «живые лаборатории». Что такое живая лаборатория? Давайте представим, что можем поместить целое сообщество в комнату с камерами слежения, а затем записать и отобразить все грани и ракурсы поведения, общения и социального взаимодействия между его участниками. Теперь представьте, что этот эксперимент длится в течение нескольких лет, пока члены сообщества живут своей повседневной жизнью.

Это и есть живая лаборатория.

За последнее десятилетие я и мои студенты научились конструировать и разворачивать такие лаборатории, где годами посекундно исследуются целые социальные организмы – коллективы, компании и даже сообщества. Наш метод прост: измерения проводятся путем сбора цифровых «хлебных крошек», получаемых из таких источников, как сенсорные датчики в мобильных телефонах, публикации в соцсетях, покупки с помощью кредитных карт и проч.

Для его применения я разработал юридические и программные инструменты защиты прав и частной жизни людей в этих лабораториях, чтобы они имели полное представление о том, что происходит с их данными, и могли выйти из игры в любой момент. В дальнейшем вы увидите, что разработанные мной решения сыграли важную роль в улучшении защиты личной информации пользователей по всему миру. (Подробную информацию об этих юридических и программных инструментах см. в Приложенияи 1: Добыча реальности и Приложении 2: Открытая система PDS.)

Все эти миллиарды записей телефонных вызовов, операций по кредитным картам и данных сети GPS позволили ученым создать новые виртуальные линзы, дающие нам возможность изучать общество в мельчайших деталях[12]12
  Lazer et al. 2009.


[Закрыть]
. Так же, как голландские мастера когда-то изготовили первые пригодные для работы оптические линзы, благодаря которым ученые смогли собрать первые микроскопы и телескопы, я и моя исследовательская лаборатория создали инструменты, собирающие все виртуальные следы целого сообщества, позволяя нам построить первые практически применимые «социоскопы». Эти новые инструменты позволяют рассматривать жизнь во всем ее многообразии и являются будущим общественных наук. Подобно тому, как изобретение микроскопа и телескопа свершило революцию в области биологии и астрономии, социоскопы в живых лабораториях вызовут переворот в области исследований поведения человека.

Социальная физика как всеохватывающая социальная наука

Большинство существующих общественных наук базируется либо на лабораторных исследованиях, либо на демографических данных – то есть средних величинах и стереотипах. Эти подходы не учитывают сложности реальной жизни, где одновременно вступают в силу все странности нашей психики. Они также упускают из виду тот крайне важный факт, что детали, имеющие отношение к людям, с которыми мы взаимодействуем, и к тому, как происходит это взаимодействие, играют не менее важную роль, чем рыночные силы и классовые системы. Социальные явления на самом деле складываются из миллионов маленьких транзакций между отдельными индивидами: люди обмениваются не только товарами и деньгами, но также информацией, замыслами и даже слухами. В этих индивидуальных транзакциях просматриваются шаблоны, вызывающие такие явления, как финансовый крах или «арабская весна». Нам необходимо понять эти микроалгоритмы, поскольку их нельзя просто свести к средним коэффициентам, поддерживающим классическое понимание общественного устройства. Большие данные дают нам возможность рассматривать общество во всей его сложности, посредством миллионов ниточек, протягивающихся от человека к человеку в процессе социального взаимодействия.

Если бы у нас было всевидящее око, мы, возможно, могли бы прийти к истинному пониманию того, как устроено общество, и предпринять шаги к решению наших проблем. К сожалению, как видно на рис. 1, практически все данные, добытые в рамках традиционных общественных наук (под номером 1), уместились рядом с координатой (0,0). Это означает, что эти наборы данных представляют собой информацию, полученную меньше чем от сотни людей и всего лишь в течение нескольких часов. Исследования под номером 2 и 3 – одни из самых крупных общественно-научных исследований на данный момент[13]13
  Barker 1968; Dawber 1980.


[Закрыть]
. За последние десять лет социологи, работающие в области вычислений, узнали, как можно задействовать большие данные, и начали использовать пакеты информации, полученные, например, от операторов сотовой связи и компаний, занимающихся социальными сетями. Типичные примеры таких исследований представлены под номером 4. Увы, даже эти большие наборы данных скудны, так как они измеряют лишь по несколько переменных за раз. Таким образом, они дают очень ограниченное представление о человеческой природе.


Рис. 1. Квалитативный обзор наблюдений и экспериментов в области общественных наук. Горизонтальная ось показывает продолжительность сбора данных, вертикальная ось – объем и качество полученной информации. Показаны следующие комплексы данных: (1) Большинство научных экспериментов в области общественных наук; (2) Midwest Field Station (Barker 1968); (3) Framingham Heart Study (Dawber 1980); (4) Данные, полученные от телефонных операторов (Gonzalez et al. 2008; Eagle et al. 2010; Hidalgo and Rodriquez-Sickert 2008); (5) Исследования Reality Mining («добыча реальности») (Eagle and Pentland 2006); (6) Социальное развитие (Madan et al. 2012); (7) Друзья и родственники (Aharony et al. 2011); (8) данные электронных бейджей (Pentland 2012b); (9) «Данные в целях развития» (D4D, http://www.d4d.orange.com/home); (10) общее направление развития.


Социальная физика стремится получить как можно более глубокие и всеохватные количественные описания. Исследования под номерами 5, 6 и 7 проводились моей собственной исследовательской группой, которая использовала смартфоны для сбора информации; они использовали «социометры», или «умные» электронные бейджи с именами, для сбора данных для исследования номер 8 (подробности см. в Приложении 1: Добыча реальности); а для исследования под номером 9 – набор «данных в целях развития» (D 4D), охватывающих всю территорию Кот-д’Ивуар.

Достаточно поверхностно изучить рис. 1, чтобы увидеть, что наборы данных, полученные из социальной физики, многократно и по всем параметрам превосходят те, которыми оперируют другие социальные науки. Они цифровые, объемные и содержат колоссальное количество объективной, непрерывной и компактной информации, которая позволяет нам строить количественные, прогнозируемые модели поведения людей в сложных повседневных ситуациях.

Важно отметить, что точка, помеченная номером 10, обозначает направление, в котором движется мир. Уже по прошествии каких-нибудь нескольких лет мы, возможно, будем располагать невероятно богатыми данными о поведении практически всего человечества – и причем постоянно. Эти данные уже существуют в мобильных сетях, базах данных кредитных карт и других источниках, но в настоящее время только технические специалисты имеют к ним доступ. Однако по мере того, как они будут становиться все более доступными для научных исследований, новая наука социальной физики получит следующий толчок. Хочется надеяться, что, как только мы разработаем более точную визуализацию моделей человеческой жизни, мы сможем лучше понимать наше современное общество и управлять им, используя инструменты, лучшим образом приспособленные к сложно взаимосвязанной сети, объединяющей людей и технологии.


В поддержку этой книги я разместил в интернете несколько самых крупных в мире и подробнейших наборов данных, полученных из живых лабораторий. Эти новейшие источники цифровой информации позволяют нам с точностью измерить алгоритмы взаимодействий между людьми – или же между людьми и торговыми компаниями – и составить схемы и диаграммы на основе повторяющихся ситуаций, с которыми люди сталкиваются в процессе жизни. В эти наборы данных живых лабораторий входят:

Друзья и родственники: Собранные в течение около полутора лет данные о небольшом сообществе молодых семей, с большим диапазоном социометрических переменных, включая место расположения, расстояния, коммуникации, покупки, использование социальных медиа, мобильных приложений, и сон[14]14
  Десятки стандартных психологических, социологических и медицинских опросов регулярно проводились в этих живых лабораториях – как правило, через интернет. Кроме того, были и более короткие, более частые опросы, проводившиеся при помощи смартфонов.


[Закрыть]
. Мы измеряли по тридцать поведенческих переменных каждые шесть минут[15]15
  Aharony et al. 2011.


[Закрыть]
. Материалы этого исследования содержат 1,5 миллиона часов количественного наблюдения за социальным опытом людей.

Социальное развитие: Собранные за девять месяцев данные об общежитии университета, с информацией о месте расположения, расстояниях и коммуникационными данными, обновляемыми каждые пять минут вместе с переменными, связанными со здоровьем, политикой и социометрией[16]16
  Madan et al. 2012.


[Закрыть]
. Это исследование включает в себя 500 тыс. часов количественного наблюдения.

Добыча реальности: Собранные за девять месяцев данные о выпускниках, работающих в двух лабораториях при университете, с местом расположения, расстояниями и использованием телефона, обновляемые каждые пять минут вместе с несколькими другими социометрическими переменными[17]17
  Eagle and Pentland 2006.


[Закрыть]
. Это исследование покрывает более 330 тыс. часов взаимодействия между людьми.

Данные электронных визиток: Данные о служащих офиса, собранные за один месяц, с местом расположения, коммуникациями и информацией о жестикуляции, измеряемые каждые шестнадцать миллисекунд, наряду с точными измерениями рабочего процесса и процесса выполнения задач[18]18
  Pentland 2012b.


[Закрыть]
.

Анонимные данные, визуальные модели, код, документация и материалы доступны по ссылке: http://reality-commons.media.mit.edu. Эти наборы данных были получены с соблюдением федерального закона США об исследованиях с участием человека[19]19
  Защиту участников обеспечивали: информированное согласие, возможность отказаться в любое время и гарантированно безопасное использование всех персональных данных, а также плата за участие.


[Закрыть]
.


Эти живые лаборатории, в частности, дают детальный срез жизни американцев, но что насчет жизни людей в развивающихся странах, где проживает большая часть населения планеты? Первого мая 2013 года я представил публике «Данные в целях развития» – возможно, первый в мире полноценный общедоступный фонд больших данных: он содержит информацию о перемещениях и телефонных звонках, а также данные об экономике, цензуре, политике, продовольствии, инфраструктуре и малоимущих, охватывающие всю область африканской страны Кот-д’Ивуар. Эти данные теперь доступны по адресу: http://www.d4d.orange.com/home.

Эти обобщенные анонимные данные были предоставлены оператором мобильной связи Orange, при содействии Левенского университета (Бельгия) и моей исследовательской группы в МТИ, а также при участии университета Буаке (Кот-д’Ивуар), проекта ООН «Глобальный пульс», Всемирного экономического форума и GSMA – международной ассоциации мобильных операторов. В последней главе этой книги мы увидим, как этот информационный фонд используется уже сейчас для улучшения государственного управления и коммунальных услуг в Кот-д’Ивуаре.

План книги

Цель этой книги – рассказать, как социальная физика объединяет большие данные о поведении людей и теорию социальной физики, чтобы создать практическую науку, которая может применяться – и уже применяется – во многих ситуациях в реальной жизни. В первой части книги я изложу теоретическую основу, используя примеры, иллюстрирующие два самых важных понятия в социальной физике:


Поток идей в социальных сетях, который делится на исследование (поиск новых идей/стратегий) и привлечение (организация совместной деятельности).

Социальное обучение, которое, наряду с социальным стимулированием, запускающим социальное давление, способствует превращению новых идей в привычки и традиции.


Эта часть книги также рассказывает о том, как с помощью цифровых «хлебных крошек» мы можем произвести точные, практические измерения таких явлений, как социальное влияние, доверие и социальное давление. Этот метод также позволит нам замерить поток идей в социальных сетях и задействовать стимулы, формирующие шаблоны социального обучения в реальных жизненных ситуациях. Я использую примеры из соцсетей в интернете, из сфер здравоохранения, финансов, политики и поведения потребителей, чтобы проиллюстрировать принципы устройства социальной физики.

Во второй части книги я приведу примеры из реальной жизни, которые покажут, как социальная физика используется для усиления гибкости, креативности и продуктивности организаций. Среди примеров: исследовательские лаборатории, креативные рекламные отделы, отделения поддержки транзакций и колл-центры.

Третья часть книги рассматривает социальную физику в более крупных масштабах, а именно в масштабах городов. Здесь я делаю акцент на том, как с ее помощью мы можем переустроить наши города и сделать их более производительными и креативными.

В заключительном разделе я расскажу о том, как социальная физика применима к общественным учреждениям. Здесь я буду анализировать роль государства, законодательных и регулирующих структур в информационном обществе и предложу ряд нововведений в сфере приватности и экономики.

Я надеюсь, что по мере продвижения по книге читатель научится мыслить категориями социальной физики. Этот новый подход во многом схож с экономическим благодаря его количественной, прогностической природе. Действительно, значительная часть лексикона, который я использую в этой книге, взята из экономики. Но вместо того чтобы изучать, как работают экономические агенты и функционируют экономические структуры, социальная физика стремится к пониманию того, как поток идей отражается в поведении и переходит в действия. Иными словами, суть социальной физики – не в том, как денежный обмен влияет на рынки, а в том, как обмен идеями направляет поведение людей – как они объединяются для поиска, выбора и присвоения новых стратегий и совместных действий.

Социальная физика также имеет поверхностное сходство с другими академическими дисциплинами – в частности, с когнитивной наукой. Однако контраст между большей частью когнитивистики и социальной физикой очень важен. Социальная физика фокусируется не на мыслях и эмоциях отдельных индивидов, а на социальном обучении как определяющем факторе привычек и норм. Основная предпосылка такова, что обучение на основе актов поведения (и соответствующих ситуативных признаков) других людей – важный и, вероятно, главный механизм, управляющий изменениями в поведении людей. Поскольку социальная физика не стремится фиксировать внутренние когнитивные процессы, она носит изначально вероятностный характер, с неуменьшаемой степенью неопределенности – ведь социальная физика игнорирует генеративную природу сознательной мысли человека.

Информационные общества: «Прометеев огонь»

Новая наука социальной физики объединяет отрасли экономики, социологии и психологии с системами связей, теорией сложности вычислений, принятием решений, а также экологическими науками и спаивает их вместе при помощи больших данных. Я расскажу, как, создавая социальные системы, выходящие за рамки рынков, классов и партий, и подробно изучая модели обмена идеями, мы сможем построить общество, которое сможет лучше предотвращать биржевые крахи, этническое и религиозное насилие, тупики в политических переговорах, распространение коррупции и опасное нарушение баланса сил. Первым шагом станет утверждение научной, надежной политики роста и инноваций, и учреждение информационных и юридических структур для защиты приватности личных и прозрачности публичных данных. Такие меры дадут нам уникальную возможность следить за тем, как работает выбранный нами курс, и знать, когда нас пытаются ввести в заблуждение или попирают наши права. Тогда мы сможем делать все возможное, чтобы быстро и эффективно исправить ситуацию.

Такое понимание информационного общества изначально предполагает, что данными не будут злоупотреблять. И все же возможность видеть внутреннее устройство рынка и политических революций, а также прогнозировать и контролировать их – это тот же «прометеев огонь», который может быть использован как во благо, так и во зло. Иными словами, чтобы реализовать все заманчивые возможности информационного общества, нам понадобится то, что я назвал «Новым соглашением по данным»: надежные гарантии постоянной доступности данных, необходимых для общего блага, и защиты населения[20]20
  Pentland 2009.


[Закрыть]
. Постоянная защита личной информации и свободы людей жизненно необходима для процветания любого общества.

В последние пять лет я участвовал в организации дискуссий на тему гарантий защиты личной свободы, проводимых среди ведущих политических деятелей, генеральных директоров международных корпораций и правозащитных групп по всему миру. В результате было достигнуто новое соглашение по данным, которое сейчас дорабатывается, чтобы затем стать частью коммерческого регламента в Соединенных Штатах, Евросоюзе и других странах[21]21
  World Economic Forum 2011. Personal data: The emergence of a new asset class. См. http://www3.weforum.org/docs/WEF_ITTC_PersonalDataNewAsset_Report_2011.pdf.


[Закрыть]
. Благодаря этим изменениям индивиды получают беспрецедентный контроль над своими данными, и в то же время повышается прозрачность и обнажается системность в публичной и частной сферах.

Хотя эти нововведения помогут защитить граждан от коммерческих компаний, они не смогут гарантировать защиту от самого государства. В июне 2013 года бывший сотрудник Агентства национальной безопасности США Эдвард Сноуден разоблачил практику массового мониторинга телефонных звонков и интернет-данных в США и назвал ее «архитектурой угнетения». Нам необходимо возобновить общественные дебаты на тему баланса между неприкосновенностью личной жизни и сбором и использованием персональных данных в целях государства – «Новое соглашение по данным» должно распространяться и на правительства. Нам также понадобятся компьютерные и коммуникационные технологии, которые помешают им злоупотреблять своей властью.

Еще одна трудность заключается в необходимости более строгого контроля над экспериментальной деятельностью в наших социальных структурах. Сегодня правительства и предприятия вводят новые директивы и системы на основе весьма неубедительных фактов. Научный метод, что сейчас широко практикуется в сфере общественных наук, неэффективен и недостаточно силен, чтобы выжить в эпоху больших данных[22]22
  В дополнение к малому масштабу экспериментов почти вся социальная наука опирается на людей из западных, образованных, международных, обеспеченных, демократических обществ. Иными словами, социальная наука – только для чудаков (Henrich et al. 2010).


[Закрыть]
. Полезен ли кофе для здоровья? А сахар? Уже больше века миллионы людей употребляют их – разве у нас не должны быть ответы на эти вопросы? Вместо них у нас есть «мнение ученых», которое меняется чуть ли не каждый день. Мы должны возродить общественные науки, построив живые лаборатории, чтобы тестировать и доказывать идеи, которые помогут нам в формировании информационных обществ.

Человечество уже ступило на путь обновления, которое оставит далеко позади такие революционные открытия, как книгопечатание и интернет. Впервые в истории у нас будут все данные для того, чтобы по-настоящему познать самих себя и понять, как эволюционирует наше общество. Лучше узнав себя, мы, возможно, сможем построить мир, где не будет войн и финансовых кризисов, где инфекционные заболевания быстро распознаются и предотвращаются, где энергия, вода и другие ресурсы не растрачиваются впустую, а органы государственной власти являются частью решения, а не частью проблемы. Однако для достижения этих целей нам необходимо сначала понять социальную физику, а затем решить, что мы как общество ценим больше всего и что мы готовы изменить, чтобы получить это.

ТЕРМИНОЛОГИЯ

У многих используемых здесь слов есть как общие лексические, так и более терминологически узкие значения из сферы экономики и других наук. Во избежание путаницы я привожу ниже ряд кратких определений:


Взаимодействие: Взаимодействие включает как прямые (например, разговор), так и непрямые (например, слушание чужого разговора) типы социального поведения.

Доверие: Доверие – это ожидание постоянной, стабильной продуктивности взаимодействия.

Идея: Идея – это стратегия (действие, возможный результат или характеристика, определяющие, в какой момент необходимо произвести это действие) дальнейшего поведения. Сравнительно удачные, полезные идеи переходят в автоматизированные действия, которые «срабатывают» при быстром мышлении[23]23
  Kahneman 2011.


[Закрыть]
.

Информация: Информация – это результаты наблюдений, которые могут быть включены в систему убеждений или же использованы для построения новой идеи.

Исследование: Исследование – это открытие новых, потенциально полезных идей в процессе создания и изучения различных социальных сетей. В компаниях рабочие группы, активно воспринимающие внешние относительно членов группы идеи, как правило, являются более прогрессивными.

Общество: Социальная физика предполагает, что человеческое общество в основном состоит из сетей, образующихся в результате взаимодействия между индивидами, не рассматривая его как совокупность классов или рынков.

Поток идей: Распространение моделей поведения и убеждений в социальной сети посредством социального обучения и социального давления. Поток идей учитывает структуру социальной сети, силу социального влияния внутри каждой пары людей, а также индивидуальную восприимчивость к новым идеям.

Привлечение: Привлечение – это процесс социального обучения, как правило, в пределах рабочего коллектива, который приводит к возникновению поведенческих норм и социального давления, укрепляющего эти нормы. В компаниях коллективы с высокой степенью распространения идей между членами, как правило, являются более продуктивными.

Социальная норма: Социальная норма – это набор выгодных стратегий, которые, по единогласному мнению всех сторон, обеспечат лучший результат взаимодействия. Нормы обычно возникают в процессе социального обучения и распространяются посредством социального давления.

Социальное влияние: Социальное влияние – это вероятность того, что поведение одного человека окажет влияние на поведение другого человека.

Социальное давление: Социальное давление – это коммуникационный рычаг, который один человек может использовать для воздействия на другого; его сила зависит от продуктивности взаимодействия между этими людьми.

Социальное обучение: Социальное обучение – это (1) усвоение новых стратегий (например, контекст, действие, желаемый результат) через наблюдение за поведением других людей, включая обучение по известным случаям; или (2) присвоение новых убеждений на основе наблюдения или полученного опыта.

Стимул социальной сети: Стимулом социальной сети является стимул, вызывающий изменения в алгоритме взаимодействия между двумя людьми.

Стратегия: Стратегия – это совокупность характеристик, определяющих ситуацию, потенциальных действий, которые можно предпринять в этой ситуации, и предполагаемых результатов этих действий.

Ценность: «Ценностью» обменных взаимоотношений я буду называть степень, в которой результаты взаимодействия отвечают общественным и личным целям, включая, например, практичность, заинтересованность и социальную поддержку.



скачать книгу бесплатно

страницы: 1 2 3 4 5 6