Андреас Вайгенд.

BIG DATA. Вся технология в одной книге



скачать книгу бесплатно

Можно согласиться с тем, что все эти данные собирают, сводят, агрегируют и анализируют для того, чтобы мы имели возможность лучше понимать плюсы и минусы предлагаемого нам выбора. Мнение человека – основополагающий элемент при оценке альтернатив, которые предполагает любое важное решение. Информация не должна руководить нами. Она должна расширять спектр наших возможностей.

Правила для эры постприватности

Понимание возрастающего значения информации в жизни человека стимулировало ряд инициатив, направленных на защиту интересов граждан. В 1970-х годах в США и Европе были разработаны примерно одинаковые принципы добросовестного использования информации. Частным лицам было предоставлено право знать, кто собирает о них сведения и как эти данные используются. Кроме того, граждане могли корректировать неточные данные о себе[14]14
  Огромная разница между подходами к защите данных между США и Европой состоит, в том числе, и в правоприменении. В США регулирующие органы для защиты граждан от рисков незаконного использования личных данных создаются отдельно для каждой отрасли, тогда как в Европе существуют единые законодательные нормы. См. издание Аппарата Президента США Big Data: Seizing Opportunities, Preserving Values, (Совместный доклад рабочей группы по большим данным и защите неприкосновенности личной жизни и Совет по развитию науки и техники), May 2014, pp. 17–18, https:// www.whitehouse.gov/sites/default/files/docs/big_data_privacy_report_may_1_2014.pdf.


[Закрыть]
. Для современных информационных потоков и средств аналитики эти защитные меры парадоксальным образом и избыточно жестки, и совершенно недостаточны одновременно.

Избыточная жесткость выражается в возможности отследить и сохранить любые данные о вас. Компания Amazon наверняка сможет доступно объяснить, как она использует полученную о вас информацию. Наверное, она даже сможет сделать это так, чтобы вы использовали это знание для принятия более обоснованных решений. Но ознакомление со всеми этими данными займет уйму времени. Многие ли захотят тратить время на прочесывание всего информационного массива? Действительно ли вам нужно понимать, каким образом в Amazon оценивают каждый параметр, или будет вполне достаточно итогового результата?[15]15
  Для понимания алгоритма обычно бывает нужно увидеть, как он работает с реальными данными, в идеале – вашими собственными в сочетании с данными других людей (что дает больше возможностей для сравнения). В соответствии с действующим законодательством большинство компаний не имеют права предоставить вам информацию о других людях без их согласия.

Это ограничивает возможности расшифровки алгоритмов вашей жизни.


[Закрыть]

В то же время эти защитные меры совершенно недостаточны, поскольку, даже если вы в состоянии контролировать каждый бит информации о себе, созданной и предоставленной лично вами, полной картины своих обращающихся личных данных вы не получите. Дело в том, что в эту картину попадает и та информация о вас, которую создают другие люди, например ваши родственники, друзья, коллеги и работодатели. Бизнесы, которые вы посещаете как онлайн, так и физически, тоже создают (а иногда и распространяют) данные о вас. То же относится и ко всем остальным, с кем вы взаимодействуете, – от разнообразных государственных и частных организаций до прохожих на улице. Кто поручится за достоверность этих данных? Поскольку в наши дни информация поступает из столь многочисленных источников, вопрос отнюдь не исчерпывается правом корректировать свои личные данные. Кроме того, даже достоверная информация может быть использована вам во вред.

На фоне масштабных количественных и качественных сдвигов в области создания, передачи и обработки информации становится совершенно очевидным, что права знать и права корректировать недостаточно. До настоящего времени попытки привести существующие правила в соответствие с требованиями времени были направлены почти исключительно на поддержание возможности индивидуального контроля над данными и сохранения тайны личной жизни[16]16
  См., в частности, законопроект «О правах потребителя в области неприкосновенности частной жизни», внесенный Белым домом в феврале 2012 года, о котором говорится на стр.19–20 издания Аппарата Президента США Big Data: Seizing Opportunities, Preserving Values See.


[Закрыть]
. К сожалению, такой подход порожден опытом прошлого века технологий. Стандарты контроля и конфиденциальности уже заставляют людей вступать в неравные отношения с информационно-технологическими компаниями. Если вы хотите повысить качество принятия решений с помощью информации, вам, скорее всего, придется согласиться с тем, что ваши данные будут собирать на условиях, которые вам продиктуют. И как только вы их примете, процесс сбора личных данных будет считаться соответствующим требованию законодательства о «контроле» вне зависимости от того, предоставляет ли вам компания – сборщик информации какие-либо варианты выбора и предохраняет ли от возможных нежелательных последствий для сохранения тайны личной жизни. Если вы хотите сохранить конфиденциальность своих личных данных, вам не следует давать согласия на их сбор и обработку. Правда, в результате вы лишитесь доступа к соответствующим информационным ресурсам и сервисам, а ценность ваших личных данных снизится. Вот и радуйтесь своему праву личного контроля.

Сегодня нам нужны стандарты, позволяющие оценить риски и пользу распространения и использования данных, а также позволяющие привлекать компании к ответственности. Два десятилетия сотрудничества с компаниями информационно-технологической отрасли привели меня к твердой убежденности в том, что соблюдение принципов прозрачности и свободы выбора – самое перспективное направление защиты от злоупотреблений в области обработки личных данных, позволяющее в то же время максимизировать выгоды от их использования.

Под прозрачностью понимается право людей знать, что происходит с их данными: что они собой представляют, куда они направляются и как способствуют получению результата пользователем. Наблюдает ли компания за вами из-за непрозрачной стороны зеркала или предоставляет окно, через которое можно видеть, что она делает с вашими данными, и, таким образом, иметь возможность судить, насколько ее интересы соответствуют вашим (и соответствуют ли вообще)[17]17
  Спасибо Эстер Дайсон, предложившей эту метафору с зеркалом и окном.


[Закрыть]
? Сколько личной информации нужно предоставить, чтобы получить нужный продукт или услугу? Исторически между частными лицами и организациями существовал серьезный информационный перекос в пользу организаций. Организации обладают не только большими возможностями для сбора информации о человеке, они могут также интерпретировать его данные, сравнивать с данными других. Баланс между тем, что вы предоставляете и что получаете взамен, должен быть совершенно прозрачен.

Оцените прозрачность в процессе покупок на Amazon по сравнению с традиционными отношениями между покупателем и розничной торговлей. Станет ли продавец в обычном магазине напоминать вам о том, что вы уже покупали этот товар, рискуя тем самым потерять в продажах? Если вы собираетесь купить на Amazon книгу, которую уже покупали на сайте, вас вежливо спросят: «Вы уверены? Вы уже покупали этот товар 17 декабря 2013 года». Если вы купили один трек из музыкального альбома, а теперь хотите купить весь альбом, Amazon «завершит покупку», то есть автоматически снизит цену на сумму, уплаченную за купленный трек. Компания отслеживает истории покупок и использует их для того, чтобы минимизировать поводы для огорчения своих покупателей. Схожим образом поступают и авиакомпании, когда информируют вас о том, что ваши накопленные мили скоро «сгорят», вместо того чтобы позволить этому случиться.

К сожалению, сегодня прозрачность – далеко не норма. Вспомните более чем типичный пример звонка в какой-нибудь центр обслуживания клиентов. Сразу же после соединения вы обязательно услышите предупреждение «Внимание! В целях контроля качества этот разговор может быть записан». Выбора у вас нет – если вы хотите поговорить с сотрудником компании, придется принять это условие. Допустим. Но почему эта запись будет доступна только компании? Что это за «цели контроля качества», когда только одна сторона имеет доступ к записи разговора? Принцип симметрии данных подразумевает, что и у вас – потребителя, который платит, – должен быть прямой доступ к этой записи.

Каждый раз, услышав, что мой телефонный разговор может записываться, я заявляю сотруднику клиентской службы, что я, пожалуй, тоже запишу этот диалог с целью контроля качества предоставляемых услуг. В большинстве случаев сотрудник вынужденно соглашается. Но случается, что на том конце вешают трубку. Конечно, я могу записать разговор и не спрашивая согласия сотрудника, – хотя, замечу, что кое-где это считается противозаконным. Тогда, если качество сервиса не будет соответствовать обещанному, я смогу обратиться к начальству с доказательствами на руках. Если и это не поможет, я могу выложить запись в сеть в надежде, что она станет вирусной и компании придется срочно исправлять ситуацию. Так произошло с Comcast[18]18
  Comcast – американская компания, крупнейший в мире оператор кабельных и эфирных телесетей. – Прим. пер.


[Закрыть]
: один из клиентов пытался отменить подписку и раз за разом натыкался на отказ, до тех пор пока не выложил запись разговоров в Twitter, где она попала в тренды[19]19
  Если вы упустили это в СМИ, то можете послушать душераздирающую запись звонка на SoundCloud: Block, Ryan, “Comcastic Service Disconnection (Recording Starts 10 Mins into Call)”, SoundCloud, July 14, 2014, https://soundcloud.com/ryan-block-10 /comcastic-service.


[Закрыть]
.

Закон не должен ограничивать возможности человека играть на равных с компаниями. Чтобы прозрачность стала новой нормой, надо, чтобы общедоступным оказался больший, а не меньший объем информации.

Но одной прозрачности недостаточно, нужна также и свобода выбора[20]20
  Мой друг Док Серлс, соавтор The Cluetrain Manifesto и автор The Intention Economy, давно ратует за право выбора в взаимодействии потребителей и компаний, и я благодарен ему за предложение использовать этот термин для обозначения всей полноты аспектов личного волеизъявления, воплощенных в этом праве.


[Закрыть]
. Под ней подразумевается право человека управлять своими данными. Легко ли вам разобраться в том, что представляют собой регламенты работы с личной информацией, которыми данная компания руководствуется «по умолчанию»? Разрешается ли вам изменять свои данные по собственному усмотрению? Можете ли вы получать результаты в удобном для вас виде или же вас ненавязчиво склоняют (или насильно заставляют!) пользоваться определенными опциями, обычно теми, которые больше устраивают компанию? Можно ли поиграть с параметрами и попробовать разные сценарии, чтобы рассмотреть суженный или расширенный диапазон возможностей? Свобода выбора – личное право человека, реализуемое путем управления параметрами и алгоритмами, выявленными информационно-технологическими компаниями. Она предполагает возможность требовать от компаний предоставления информации на ваших условиях.

На фундаментальном уровне свобода действия подразумевает наличие у человека возможности создавать полезные именно ему данные. Amazon в полной мере воплотила идею нецензурируемых отзывов. Компании совершенно все равно, положительные это отзывы или отрицательные, пяти– или однозвездочные, написанные с целью заслужить одобрение окружающих или в рамках воплощения заветной мечты стать литературным критиком. Важно то, что они полезны другим пользователям, которые решают, что им купить. Например, отзывы могут показать, что покупатель жалеет о сделанном выборе даже в случае, когда он не возвращает товар продавцу. Такого рода данные помогают потребителю решить, насколько рекомендуемый товар может соответствовать его ожиданиям. Amazon предоставила потребителю большую свободу выбора.

Маркетологи любят поговорить о таргетировании, сегментации и конверсии. Не знаю, как вы, но лично я не хочу, чтобы меня таргетировали, сегментировали, конвертировали или нарезали тонкими ломтиками. Свободе выбора чужды подобные понятия. Не стоит ожидать, что однажды руководители всех компаний по своей собственной инициативе начнут руководствоваться принципами прозрачности и предоставления пользователю свободы выбора. И нам требуются четко очерченные границы прав, позволяющие сделать прозрачность и свободу выбора основой создания реального, практически полезного инструментария.

Если мы сможем заставить компании, занимающиеся сбором данных, согласиться с набором взвешенных правил и способов работы, это приведет к тому, что я называю «сменой значений» – полному пересмотру сложившейся практики в отношениях между частными лицами и учреждениями. Решение компании Amazon передать потребителям формирование большей части контента, связанного с товарами, – один из примеров такой смены значений, и революция в области социальных данных способна предоставить еще больше подобных возможностей. Одновременно с расширением инструментария, помогающего человеку принимать наиболее подходящие ему решения, падает эффективность традиционной рекламы и манипулирования потребителем. Времена, когда покупки осуществлялись под диктовку компаний, миновали. В скором будущем вы сможете диктовать компании, что она должна произвести для вас. Кое-где это уже возможно.

Смены значений – важный элемент картины мира с точки зрения физики. Часто они обозначают фазовые переходы, когда некая перемена во внешней среде вызывает резкие изменения свойств вещества, например переход воды из жидкого в газообразное состояние при достижении точки кипения. Воздействие, которое возрастающий объем информации оказывает на общество, можно сравнить с воздействием возрастающей температуры нагревания на физическую систему. При определенных условиях, то есть когда информационно-технологические компании предоставят пользователям прозрачные условия и свободу выбора, произойдет смена значений в пользу частного лица, то есть главным бенефициаром во взаимоотношениях человека и компании станет человек, а не компания или ее директор по маркетингу.

Заинтересованными лицами революции в использовании социальных данных являемся мы все. А тот, кто хочет извлечь из социальных данных пользу, должен делиться информацией о самом себе. Точка. Ценность социализации информации часто проявляется в виде расширения возможностей для принятия оптимальных решений в коммерческих переговорах, при покупке товаров и услуг, получении кредитов, в поиске работы, при получении образовательных и медицинских услуг и в общественной жизни в целом. Цена и риски предоставления личных данных должны быть как минимум эквивалентны получаемым взамен благам. Существенна прозрачность того, что узнают о человеке компании и что они делают с этой информацией. То же относится и к возможности частного лица иметь определенный контроль над информационными продуктами и услугами. Без этого судить о том, насколько эквивалентным является происходящий обмен, невозможно.

Баланс сил

Доступ к информации – одно из главных преимуществ. Те, у кого ее больше, почти всегда оказываются в выигрыше, как пресловутый продавец подержанных машин, втюхивающий развалюху несведущему покупателю. С удешевлением и повсеместным распространением средств коммуникации и обработки данных информации стало намного больше, соответственно намного возрос и риск существенных информационных перекосов, поскольку ни одному частному лицу не под силу справиться с обработкой всех имеющихся данных.

Большая часть создаваемой и распространяемой информации касается личной жизни: где мы живем, где работаем, где бываем, кого любим, а кого – нет, с кем проводим время, что едим, насколько регулярно занимаемся спортом, какие лекарства принимаем, какими бытовыми приборами пользуемся, что затрагивает наши чувства. Для компаний, собирающих и анализирующих данные, наша жизнь прозрачна. Иногда эти компании занимаются незаконной перепродажей информации, но чаще держат ее у себя для применения исключительно по собственному усмотрению. Необходимы более детальные правила использования личных данных, не допускающие возможности их изменения или обмена ими в какой-либо форме без разрешения их носителя. И те, кто создает данные, и те, кто их собирает и анализирует, должны обладать равной прозрачностью друг для друга и свободой выбора.

Для этого нам потребуется серьезно пересмотреть свое отношение к личным данным и самим себе. В первой главе я расскажу о некоторых способах, которые применяют информационно-технологические компании для анализа личных данных и превращения их в продукты и сервисы. В главе 2 речь пойдет о том, как цифровые следы нашей жизнедеятельности (история поиска, клики, просмотры, нажатия и свайпы) «затаптывают» иллюзии приватности, формируя представление о нашей личности и подавая сборщикам данных важные сигналы вне зависимости от того, хотим мы этого или нет. В главе 3 в центре моего внимания окажутся связи между людьми и то, как в цифровую эпоху социальные сети меняют представления о доверии. В главе 4 рассмотрим, насколько четкую картинку наших перемещений, настроений и уровня внимания позволяет получить анализ данных, полученных из объединенных сетей самых разнообразных датчиков (не только видеокамер).

Исходя из этого анализа, я формулирую шесть видов прав, соблюдение которых считаю необходимым условием того, чтобы в будущем данные о людях служили именно им самим. Право на доступ к данным и право на проверку компаний, собирающих и обрабатывающих данные, относятся к вопросу повышения прозрачности. Право на исправление данных, право на удаление данных, право на экспериментирование с данными и право на перенос данных в другие компании относятся к сфере повышения степени контроля человека над своими личными данными и обеспечения свободы его выбора. Распространение этих прав на личные данные и их использование будет иметь значительные последствия для всех нас. В заключительной главе, посвященной воплощению этих прав в реальность, мы рассмотрим, как это скажется на покупках, платежах, инвестициях, работе, учебе и управлении общественными ресурсами.

Мы находимся на переломной стадии оформления отношений между людьми, передающими свои данные, и компаниями, создающими на их основе продукты и услуги. Это не просто изменения в правилах игры – сама игра стала качественно иной. Ее новые правила требуют пересмотра отношений между покупателями и продавцами, инвесторами и банками, работниками и работодателями, пациентами и врачами, учениками и учителями, гражданами и государством. Пора осознать, что в действительности означает использование данных, какие выгоды можно из этого извлекать и как контролировать последствия этого процесса, и занять по этим вопросам твердую позицию. Тогда мы сможем понять, насколько наши собственные интересы совпадают с интересами компаний, собирающих информацию о нас. Как и в подавляющем большинстве случаев, все изменения идут не от новых технологий и машин. Революция происходит в результате корректировки ожиданий и социальных норм в эпоху распространения новых технических средств.

Данные на людей могут стать данными для людей, если мы примем вызов и окажемся на высоте в решении этой задачи. Добро пожаловать в революцию.

Глава 1
Как научиться разбираться в данных
Основной инструментарий цифрового гражданина

В XVIII веке грамотным считался человек, способный прочитать вслух знакомые ему куски из Библии или катехизиса; в наши дни человека, не умеющего большего, сочли бы функционально неграмотным – неспособным усвоить тексты, которые необходимы для экономического выживания[21]21
  Miller, George A., “The Challenge of Universal Literacy”, Science 241 (September 9, 1988), p. 1293, http://science.sciencemag.org/content/241/4871/1293.


[Закрыть]
.

Джордж Миллер

Как устроена обработка данных и какая именно информация о вас представляет ценность?


«Данные для людей» – не просто лозунг. В повседневной жизни мы постоянно сталкиваемся с информационными продуктами и услугами в виде рейтингов и рекомендаций, созданных на основе социальных данных. На смену традиционным рекламным деятелям пришли специалисты по обработке и анализу данных, которые пропускают через просчитанные алгоритмы несметные количества цифровых следов миллиардов людей. Изменения в ментальности имеют даже более важное значение, чем лавинообразный рост количества получаемой нами информации. Чтобы сделаться полноценным участником революции в использовании социальных данных, необходимо отбросить старые «потребительские» установки по принципу «бери, что дают» и переключиться на новое мышление – мышление активного созидателя социальных данных. Происходят сдвиги в балансах сил между продавцами и покупателями, банкирами и заемщиками, работодателями и работниками, докторами и пациентами, учителями и учениками. Информация о людях и от людей может и должна стать информацией для людей.

На самом деле нет ничего важнее запроса на информацию для людей. Социальные данные – самое ценное сырье XXI века, новая нефть[22]22
  Я использую эту метафору в своей преподавательской работе уже много лет и дважды выступал на тему переработки первичных данных в 2011 году – в ООН и на конференции O’Reilly Strata Summit. Но в этом я не одинок. Среди тех, кто говорит о данных, как о новой нефти, – Клайв Хамби, участвовавший в создании клубной карты британской сети супермаркетов Tesco’s – одной из первых карт лояльности, учитывавшей все покупки в корзине покупателя. В ООН я выступал в рамках программы Global Pulse, запущенной по инициативе Генерального секретаря. Видеозапись доступна на http://www.youtube.com/watch?v=lbmsDH8RJA4.


[Закрыть]
. Такая аналогия представляется вполне уместной по целому ряду причин. На протяжении более чем ста лет нашу экономику и общественно-политическую жизнь во многом определяли нефть и развитие технологий ее добычи, хранения и переработки в продукцию, потребляемую каждым жителем планеты. Сегодня возможность переработки персональных данных в продукты и услуги привносит в жизнь человечества изменения, сопоставимые с эффектом промышленной революции.

Нефть не используется в ее первичном состоянии. Ее нужно переработать в автомобильное горючее, пластмассы и многие другие продукты нефтехимии. В свою очередь нефтепереработка дала толчок развитию техники индустриальной эпохи и сыграла важную роль в производстве подавляющего большинства видов физической продукции современной экономики. Схожим образом и первичные персональные данные сами по себе являются достаточно бесполезными. Данные приобретают ценность в результате переработки – агрегирования, анализа, сравнения, фильтрации и дистрибуции новых информационных продуктов и сервисов. В отличие от продукции нефтепереработки, продукты переработки данных становятся основой не индустриальной революции, но революции социальных данных.

К счастью, информация как ресурс радикальным образом отличается от нефти. Запасы нефти на планете конечны, и по мере истощения этого ресурса его эксплуатация обходится все дороже. Количество же информации, напротив, растет в геометрической прогрессии, а стоимость технологий ее передачи и обработки неуклонно снижается. По состоянию на конец 2015 года смартфонами пользовались более половины совершеннолетних граждан[23]23
  “Planet of the Phones”, The Economist, February 28, 2015, http://www.economist.com/news/leaders/21645180-smartphone-ubiquitous-addictive-and-transformative-planet-phones; Rogowsky, Mark, “More Than Half of Us Have Smartphones, Giving Apple and Google Much to Smile About”, Forbes, June 6, 2013, http://www.forbes.com/sites/markrogowsky/2013/06/06/more-than-half-of-us-have-smartphones-giving-apple-and-google-much-to-smile-about.


[Закрыть]
. Среднестатистический американец проводит в разговорах по мобильному телефону примерно два часа в день[24]24
  Lunden, Ingrid, “80 % of All Online Adults Now Own a Smartphone, Less Than 10 % Use Wearables”, TechCrunch, January 12, 2015, http://techcrunch.com/2015/01/12/80-of-all-online-adults-now-own-a-smartphone-less-than-10-use-wearables.


[Закрыть]
. По существующим оценкам, в течение дня люди прикасаются к своим телефонам от двухсот до трехсот раз – едва ли не чаще, чем большинство из нас прикасается к своей партнерше за месяц[25]25
  Tecmark, “Smartphone Usage Statistics 2014: UK Survey of Smartphone Users”, October 8, 2014, http://www.tecmark.co.uk/smartphone-usage-data-uk-2014.


[Закрыть]
. Информация, в отличие от нефти, не иссякнет никогда.

Использование нефти ограничено факторами ее дефицита и вещной формы, а использование информации практически не ограничено, учитывая ее изобилие и цифровую форму. Конкретный объем сырой нефти может быть использован для переработки в готовую продукцию лишь единственным владельцем, тогда как одним и тем же информационным массивом могут одновременно пользоваться и превращать его в разнообразные продукты многие. В основе наших законов и социальных норм лежит идея дефицитности информации. Так, например, отсутствие информационного поля породило страхование как способ защиты от неприятностей и материальных потерь, связанных с чрезвычайными жизненными обстоятельствами. Поскольку возможность точно рассчитать вероятность заболевания диабетом или ограбления для каждого конкретного человека отсутствовала, страховщики делили людей на группы риска и устанавливали для каждой из них среднюю ставку страховых взносов. По мере роста объема информации мы сможем прогнозировать риск для каждого конкретного человека и индивидуализировать суммы страховых взносов. Можно делать вид, что данных не существует, но можно признать факт их наличия и задуматься над тем, как это может изменить нашу жизнь. Какой мир нам хотелось бы создать при помощи этого нового вида ресурсов?



скачать книгу бесплатно

страницы: 1 2 3 4 5 6 7 8 9