Андреас Вайгенд.

BIG DATA. Вся технология в одной книге



скачать книгу бесплатно

тайна частной жизни узаконена


Google, Facebook и иже с ними (наши дни)

тайна частной жизни – иллюзия, и нам нравится делиться информацией о себе


Мы заботливо оберегали свою частную жизнь на протяжении последних ста лет, но настало время признать, что ее тайна – всего лишь иллюзия. Мы хотим иметь возможность привлекать к себе внимание, ощущать себя частью чего-то большего и контактировать с людьми. Идея, осенившая судью Брэндиса, была прекрасна, но это была идея его эпохи, когда информация была скудной, общественная жизнь ограничивалась рамками местного сообщества, а коммуникации стоили дорого. Тогда было просто предотвратить публикацию своей фотографии в случае, если она вам не нравилась. Сегодня это не так. Кроме того, для демократии анонимность не является настройкой по умолчанию. Лучше создать новые нормы, учитывающие реалии настоящего и возможности будущего, чем идеализировать приватность и надеяться на то, что законы прошлого будут защищать нас и впредь. Чтобы поставить информацию на службу людям, нужны прозрачность и свобода выбора.

Вместо того чтобы тратить силы на разграничение личного и публичного и выстраивать стены, ограждающие информацию (или ограждающие от нее), давайте сосредоточимся на возможности быть самими собой. Это позволит нам в полной мере использовать инфопереработку и достичь баланса между потенциально негативными и потенциально позитивными последствиями распространения социальных данных.

Все в интернете знают, что ты собака

В том, что касается социальных данных, тайны частной жизни не существует. Ее больше нет. Подпись под знаменитой карикатурой из журнала «Нью-Йоркер» гласила: «В интернете никто не знает, что ты собака»[88]88
  Газета «Нью-Йорк Таймс» пишет, что эта карикатура, опубликованная 5 июля 1993 года, вопроизводилась в других СМИ больше, чем любая другая за всю историю существования журнала. См. Fleishman, Glenn, “Cartoon Captures Spirit of the Internet”, New York Times, December 14, 2000, http://www.nytimes.com/2000/12/14/technology/cartoon-captures-spirit-of-the-internet.html.


[Закрыть]
. С 1993 года, когда была опубликована эта карикатура, изменилось очень многое. Сегодня правильнее было бы сказать: «Весь интернет знает, что ты собака. Ошейник у тебя синий. Ты гоняешь кошек. А твои хозяева уехали отдыхать». Это потому, что ты сам сообщил эту информацию инфопереработчикам, чтобы иметь возможность общаться с друзьями и получать персональные рекомендации. Это твоя плата за возможность ознакомиться с рекламой кормов Purina Puppy Chow. А все думали, что в интернете можно оставаться анонимным.

Но информация была привязана к «удостоверению личности» задолго до появления Facebook.

В середине 1990-х годов теоретик информатики Латания Суини решила выяснить, насколько в действительности анонимна «анонимная» база данных о состоянии здоровья[89]89
  Суини провела этот эксперимент, будучи студенткой магистратуры МТИ. Сейчас она преподает государственное управление и технологии в Гарвардском университете и является директором его Лаборатории защиты информации


[Закрыть]
. Штат Массачусетс решил, что предоставление научному сообществу информации о посещениях госслужащими врачей в клиниках соответствует государственным интересам. Не будучи совсем дураками, чиновники понимали, что передавать эти данные с указанием имен людей нельзя, и удалили ряд идентификаторов – фамилии, адреса и номера карточек социального страхования. Но поскольку статистика предназначалась для целей совершенствования системы здравоохранения, кое-какие данные о пациентах в ней оставили – пол, дату рождения и почтовый индекс. Сопоставив эти три элемента информации с другой базой данных – списками избирателей, зарегистрированных по городскому округу Кембриджа, официально доступных любому человеку за плату в двадцать долларов, Суини смогла вычислить медицинскую карту губернатора штата. После чего доктор Суини «сделала театральный жест, направив копию медицинской карты губернатора со всеми диагнозами и выписанными рецептами прямо ему в офис»[90]90
  Ohm, Paul, “Broken Promises of Privacy: Responding to the Surprising Failure of Ano-nymization”, UCLA Law Review 57, no. 6 (August 2010), p. 1720, http://www.uclalawreview. org/broken-promises-of-privacy-responding-to-the-surprising-failure-of-anonymization-2.


[Закрыть]
.

По оценке Суини, зная пол, возраст и почтовый индекс человека, можно идентифицировать 87 процентов населения США[91]91
  Sweeney, Latanya, Uniqueness of Simple Demographics in the U. S. Population, Laboratory for International Data Privacy working paper LIDAP-WP4–2000, http://dataprivacylab.org/projects/identifiability/index.html.


[Закрыть]
. Более поздние исследования понизили этот показатель до примерно 63 процентов – тоже поразительно много, учитывая, что это можно сделать без использования намного более точных сведений, которыми люди постоянно делятся в Facebook и на других сайтах, где собирают социальные данные[92]92
  Golle, Philippe, “Revisiting the Uniqueness of Simple Demographics in the U. S. Population”, Proceedings of the 5th ACM Workshop on Privacy in the Electronic Society (New York: Association for Computing Machinery, 2006), pp. 77–80, http://dl.acm.org/citation. cfm?id=1179615.


[Закрыть]
. Почему для идентификации личности человека нужно столь мало информации, поясняет порядковый расчет. В США примерно 40 000 активных почтовых индексов и около 300 миллионов человек населения, из чего следует, что на один почтовый индекс приходится примерно по 7000 жителей, которые приблизительно поровну делятся на мужчин и женщин[93]93
  US Post Office FAQ, http://faq.usps.com. Если бы были присвоены все 90 000 возможных номеров (10000–99999), процент возможности точной идентификации людей был бы еще выше. Другая причина невозможности более высокого процента возможности точной идентификации состоит в неравномерном распределении населения США по почтовым индексам.


[Закрыть]
. Если предположить, что количество новорожденных равномерно распределяется по количеству дней в году, то получается, что «привязанными» к одному почтовому индексу будут по десять мужчин или женщин с одинаковым днем рождения.

Теперь посмотрим на социальные данные, которыми обычно располагает инфопереработчик. Представление о том, что человека нельзя идентифицировать по его цифровому следу, рассыпалось в пух и прах после того, как два крупнейших инфопереработчика поделились «обезличенными» социальными данными с учеными. Сначала интернет-провайдер AOL предоставил для исследовательских целей историю поиска 658 000 пользователей за трехмесячный период. Однако по чьей-то оплошности эти данные оказались в сети, и двум журналистам из газеты «Нью-Йорк таймс» удалось установить личности нескольких человек по их поисковым запросам[94]94
  Barbaro, Michael, and Tom Zeller, Jr., “A Face Is Exposed for AOL Searcher No. 4417749”, New York Times, August 9, 2006, http://www.nytimes.com/2006/08/09/technology /09aol.html.


[Закрыть]
. Это оказалось довольно просто, поскольку люди любят искать информацию о самих себе или своих родственниках или прокладывать маршруты от своего домашнего адреса. Затем интернет-видеосервис Netflix устроил конкурс на самый точный прогноз оценки, которую зритель поставит фильму, на основе анализа предыдущих оценок других пользователей. Для построения алгоритмов участникам нужны были данные, и компания предоставила «100 миллионов оценок, поставленных 480 000 клиентами, с датой каждой оценки»[95]95
  Singel, Ryan, “Netflix Spilled Your Brokeback Mountain Secret, Lawsuit Claims”, Wired, December 17, 2009, http://www.wired.com/2009/12/netflix-privacy-lawsuit.


[Закрыть]
. Имена клиентов не раскрывались, но двум ученым из Университета штата Техас в Остине, Арвинду Нараяну и Виталию Шматикову, удалось деанонимизировать людей из базы данных путем сопоставления обезличенной информации с рецензиями, опубликованными на сайте IMDB.com[96]96
  Narayan, Arvind, and Vitaly Shmatikov, “Robust De-Anonymization of Large Sparse Datasets”, paper presented at the 2008 IEEE Symposium on Security and Privacy, Oakland, CA, May 18–21, 2008, pp. 111–125, http://dl.acm.org/citation.cfm?id=1398064.


[Закрыть]
. В чем, собственно, проблема, если эти рецензии уже были достоянием гласности? А в том, что клиенты Netflix не выкладывают отзывы о всех фильмах, которые смотрят, и некоторые из репертуара «тайно любимых» ими фильмов были весьма показательными. По крайней мере, так утверждала истица, чье имя не разглашается, подавшая на Netflix в суд. У нее возникли опасения, что теперь каждый из 50 000 ученых, получивших доступ к базе данных конкурса, знает, что она лесбиянка.

Даже если вы спокойно отнесетесь к тому, что список просмотренных вами фильмов выложат на всеобщее обозрение, вам вряд ли понравится, если будет обнародована вся история ваших поисковых запросов в интернете. Если вы не отличаетесь от подавляющего большинства людей, то чаще всего вводите в Google Maps свой домашний адрес. Ваше место жительства, посещаемые места, покупки, люди, которыми вы интересуетесь, и проблемы, которые вас беспокоят, относятся к наиболее интимным подробностям жизни. Поисковые запросы отражают и то, что в данный момент волнует общество, и Google предлагает получить представление об этом с помощью обработанной информации на Google Trends. Многие считают, что в Trends преобладают новости, но там можно узнать и о том, что в последние пару лет возрос интерес людей к таким проблемам, как интернет-травля и трансгендер. В то же время поисков по словам «приватность» и «транссексуал» стало меньше[97]97
  Судя по Google Trends, “большие данные” не были на слуху у общественности до 2011 года.


[Закрыть]
.

Теперь представьте, что у вас есть возможность видеть чей-то поиск в режиме реального времени. В 1990-х я навещал своего приятеля из Стэнфордского университета, который работал в стартапе в области поисковых систем. Я мог следить за поступающим потоком запросов. Один из них привлек мое внимание: кто-то только что искал «как совершить самоубийство»[98]98
  Что касается темы самоубийства, метаанализ, проведенный учеными Оксфордского университета, показал, что «существенно более половины (59 процентов) опрошенных молодых людей сказали, что вели поик в интернете по слову ‘самоубийство’». См. Daine, Kate, Keith Hawton, Vinod Singaravelu, Anne Stewart, Sue Simkin, and Paul Montgomery, “The Power of the Web: A Systematic Review of Studies of the Influence of the Internet on Self-Harm and Suicide in Young People”, PLoS One 8, no. 10 (October 30, 2013), http://journals.plos.org/plosone/article?id=10.1371/journal. pone.0077555.


[Закрыть]
. Что делать в таком случае? Отследить пользователя по его IP-адресу через сервис-провайдера и позвонить на «горячую линию» предотвращения самоубийств? А не будет ли это вторжением в личную жизнь? Может быть, сначала попробовать внимательно изучить историю поиска этого пользователя, чтобы попробовать понять его мотивацию и более точно оценить вероятность события, которое сразу же приходит в голову при виде такого запроса? А может быть, это писатель, собирающий материал, у которого и в мыслях нет причинить себе вред? Но затем появляется следующий запрос этого человека – «мост Золотые Ворота», где покончили с жизнью более 1600 человек[99]99
  Эту цифру назвал сержант Калифонийской дорожной полиции Кевин Бриггс, выступая с рассказом о патрулировании моста Золотые Ворота на TED Talk. См. Briggs, Kevin, “The Bridge Between Suicide and Life”, TED Talk, March 21, 2014, https://www.ted.com/talks/kevin _briggs_the_bridge_between_suicide_and_life.


[Закрыть]
. И после этого вы спокойно отвернетесь от монитора и вернетесь к своей работе по улучшению качества поиска, забыв о том, что человек в опасности? Простого ответа на подобные вопросы не существует.

Схожим образом подробности о вас, а иногда и о ваших близких сообщают ваши покупки в интернете. Чтобы доставить вам заказ, Amazon нужны данные вашей кредитной карточки, в том числе ваши имя и адрес. Сообщить правильный адрес в ваших интересах, иначе посылка до вас не дойдет. В то же время история заказов может вводить в заблуждение, если в ней указаны вещи, которые покупались для кого-то еще. В Amazon можно помечать приобретаемый товар значком «в подарок», и тогда он не будет учитываться в рекомендациях для вас[100]100
  Вы можете сделать это на своей страничке “My Amazon”: https://www.amazon.com/gp/yourstore /iyr.


[Закрыть]
. Алгоритмы обработки данных могут отделять то, что вы указали как покупку не для себя, от всех других ваших заказов. Когда вы покупаете блузку в подарок женщине, то, выбирая размер, сообщаете информацию о ее комплекции. Если это происходит за одну-две недели до Дня матери, а фамилия получательницы совпадает с вашей, алгоритмы Amazon могут сделать вывод о ваших родственных связях. Возможно, что ближе к следующему Дню матери Amazon порадует вас рекомендациями подарков по этому поводу.

Страничка Your Amazon предоставляет пользователям определенную прозрачность и свободу выбора. Возможность просматривать свою первичную информацию, в том числе историю покупок, позволяет контролировать данные, которые становятся основой для выработки персональных рекомендаций. В историю покупок можно включать и вещи, купленные в других местах, причем даже приобретения, сделанные много лет назад. В 2014 году похожий подход был применен в Facebook: «Журнал действий» представляет собой список запросов друзей, лайков, историй и фото с вашими тэгами, приглашений на мероприятия и многого другого. При желании можно удалять из истории отдельные элементы данных. А поскольку ваша цифровая личность в Facebook используется для персонификации рекламы, удаление части данных позволяет влиять на то, какие предложения вам будут присылать[101]101
  Facebook называет это «удалением», но эта информация не удаляется насовсем. Происходит это потому, что найти и вычистить все случаи ее появления на серверах значительно дороже, чем сохранять их, изменив способ пользования. Кроме того, в главе 3 мы убедимся, что Facebook постоянно экспериментирует, чтобы усовершенствовать взаимодействие с пользователями и повысить их активность. В одном из исследований рассматривалась самоцензура – случаи, когда люди начинали писать апдейты и комментарии, но в конечном итоге решали не публиковать их. Отмененные апдейты и комментарии нельзя удалить, поскольку их не публиковали, и тем не менее в Facebook изучают их контекст – всевозможные «как и где». См. Das, Sauvik, and Adam Kramer, “Self-Censorship on Facebook”, Proceedings of the 7th International AAAI Conference on Weblogs and Social Media, Cambridge, MA, July 8–11, 2013 (Palo Alto: AAAI Press, 2013), https://www.aaai.org/ocs/index.php/ICWSM/ICWSM13/paper/viewFile/6093/6350.


[Закрыть]
.

Удаление одного, двух или двадцати лайков из истории действий вряд ли изменит общий характер представления о вас. Исследования Дэвида Стиллуэлла из Психометрического центра Кембриджского университета показали, что действия в Facebook действительно достаточно точно отражают черты личности пользователя. Несколько тысяч пользователей Facebook прошли тест на «Большую пятерку» индивидуальных различий (открытость опыту, сознательность, экстравертность, доброжелательность и нейротизм), а затем Стиллуэлл предложил другой группе участников опыта оценить черты характера этих пользователей исходя из их профайлов. Обе оценки оказались удивительно схожими. Обычно образ человека в Facebook довольно точно отражает действительность – люди остаются самими собой, даже когда тщательно редактируют свои профайлы в социальных медиа[102]102
  Bachrach, Yoram, Michal Kosinski, Thore Graepel, Pushmeet Kohli and David Stillwell, “Personality and Patterns of Facebook Usage”, Proceedings of the 4th Annual ACM Conference on Web Sciences, Evanston, IL, June 22–24, 2012 (New York: Association for Computing Machinery, 2012), pp. 24–32, http://dl.acm.org/citation.cfm?id=2380722.


[Закрыть]
. Если совершенно незнакомые люди могут оценить основные черты вашего характера по ленте событий на вашей странице в Facebook, то алгоритмы тем более в состоянии это сделать. Чтобы иметь возможность держать друзей и знакомых в курсе своей жизни, придется мириться с выводами, к которым придут эти алго-ритмы.

В 2013 году Стиллуэлл, его коллега Майкл Косински и группа исследователей из Microsoft Research решили выяснить, насколько точно можно судить об интеллектуальном уровне, этнической принадлежности, политических взглядах, сексуальной ориентации и наличии наркозависимости по поведению человека в Facebook. Для этого они создали приложение YouAreWhatYouLike. По утверждению авторов, в 88 процентах случаев их модель «проводила точные различия между мужчинами гетеросексуальной и гомосексуальной ориентации» исключительно на основе лайков, причем не обязательно в темах, связанных с политикой или правами человека[103]103
  Kosinski, Michal, David J. Stillwell and Thore Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, Proceedings of the National Academy of Sciences USA 110, no. 15 (April 9, 2013), p. 5802, http://www.pnas.org/content/early/2013/03/06/1218772110. Одна из трудностей, возникающих при оценке состоятельности подобных научных трудов, вызвана статистикой свойств личности. Так, если модель построена исходя из предпосылки гетеросексуальной ориентации 100 процентов анализируемых мужчин, она будет точной в 90 процентов случаев, поскольку примерно 10 процентов пользователей мужского пола указывают на наличие у себя «интереса к мужчинам». Тем не менее, выводы исследования на основе приложения YouAreWhatYouLike представляют интерес, особенно в силу того, что такие индивидуальные особенности, как, например, уровень интеллектуального развития, выявляются другими методами.


[Закрыть]
. По данным исследования, достоверными признаками мужской гомосексуальности были, в частности, лайки на «Косметику MAC» и мюзикл «Злая», а среди явных признаков мужской гетеросексуальности была реакция на Wu Tang Clan[104]104
  Хип-хоп-группа. – Ред.


[Закрыть]
[105]105
  Kosinski, Stillwell, and Graepel, “Private Traits and Attributes Are Predictable from Digital Records of Human Behavior”, p. 5804.


[Закрыть]
. Проверяя кандидатов на позицию, работодатели используют тесты на ай-кью и личностные качества. Вполне возможно, что в один прекрасный день вас попросят установить специальное приложение, чтобы оценить справедливость ваших утверждений о своей высокой организованности или стрессоустойчивости[106]106
  Для доступа к лайкам в Facebook исследователи использовали программный интерфейс приложения (API); им было труднее идентифицировать тех, кто использовал настройки приватности для ограничения доступа к своим лайкам, даже несмотря на их согласие участвовать в оценке индивидуальных особенностей. См. http://applymagicsauce.com. В интервью Косински говорил: «Это может приносить огромную пользу в деле подбора персонала»; Adams, Stephen, “‘Like’ Curly Fries on Facebook? Then You’re Clever”, Telegraph, March 12, 2013, http://www.telegraph.co.uk/technology/news/9923070/Like-curly-fries-on-Facebook-Then-youre-clever.html.


[Закрыть]
.

Данные о личных качествах могут формироваться и без активного участия человека. Один из таких примеров – несметное число фотографий, выложенных в сеть. Появление ваших изображений в интернете – вне вашего контроля, а права на них – и подавно. Если вас случайно сфотографировали во время какого-то мероприятия, идентификация вашей личности всего лишь вопрос времени. В лаборатории искусственного интеллекта Facebook, которую возглавляет Ян Лекун, разработана система DeepFace, которая может определять идентичность лиц на фотографиях с очень высокой точностью[107]107
  Simonite, Tom, “Facebook’s New AI Research Group Reports a Major Improvement in Face-Processing Software”, MIT Technology Review, March 17, 2014, http://www.technologyreview.com/news/525586/facebook-creates-software-that-matches-faces-almost-as-well-as-you-do; Taigman, Yaniv, Ming Yang, Marc’Aurelio Ranzato, and Lior Wolf, “DeepFace: Closing the Gap to Human-Level Performance in Face Verification”, paper presented at the IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, June 24–27, 2014, pp. 1701–1708, https://www.cs.toronto.edu/~ranzato/publications/taigman_cvpr14.pdf.


[Закрыть]
. Система пока не может самостоятельно определять имя человека на изображении, но если фото подписано, алгоритм присвоит эту подпись всем остальным фото с похожими лицами. Создается и другая программа, которая будет анализировать место действия, то есть сможет различать, сфотографированы ли вы в людном баре или на пустынном холме. В зависимости от того, где вас фотографируют чаще, система отнесет вас либо к любителям потусоваться, либо к одиноким странникам.

Научный сотрудник Microsoft Research Синтия Дворк с коллегами доказали, что сам факт существования баз данных подразумевает информационную открытость любого человека. Базы данных существуют для того, чтобы предоставлять ответы, и можно сформировать такую последовательность вопросов, утвердительным ответам на которые будет соответствовать единственный человек в базе. Обычно Синтия демонстрирует это на таком примере: сначала она спрашивает, сколько человек с признаками серповидноклеточной анемии значится в медицинской базе данных сотрудников Microsoft. Затем уточняет, сколько из них мужчин с вьющимися волосами в должности старшего научного сотрудника. Поскольку Синтия – единственный в Microsoft старший научный сотрудник – женщина с вьющимися волосами и признаками серповидноклеточной анемии, разница между ответами на два ее вопроса точно указывает на нее[108]108
  Синтия использует этот пример в своей лекции под названием «Я – в базе данных (Но никто об этом не знает)»; I’m in the Database (But Nobody Knows), Dean’s Lecture, University of California – Berkeley School of Information, February 4, 2015, http://www.ischool.berkeley.edu/newsandevents/events/deanslectures/20150204.


[Закрыть]
.

Люди предоставляют данные для переработки, чтобы получать результаты, помогающие в принятии решений. В базах данных, похожих на базу из примера Синтии Дворк, собирается относительно специфическая информация ограниченного объема. Это так называемые малые данные. Они не сопоставимы с уму непостижимым количеством «следов», которые накапливают современные центры обработки «больших данных». Чтобы получить от инфопереработчика нечто действительно полезное, надо предоставить ему точные исходные данные, например о ваших интересах и предпочтениях. Если вы не готовы поделиться этой информацией, придется удовлетвориться рекомендациями для среднестатистического гражданина, то есть тем, что пользуется популярностью или подходит большинству обывателей. Если вы предоставите неверные исходные данные, то, скорее всего, получите совершенно бесполезные результаты на выходе. Альтернатива выглядит так – незначительный выигрыш в приватности оборачивается проигрышем в полезности.

Что за псевдонимом?

Решение предоставлять или не предоставлять личную информацию влечет за собой последствия. В одной ситуации раскрытие своих идентификационных данных может оказаться рискованным или вредным; в другой ситуации то же самое может произойти, если они не предоставлены. Цифровые следы, оставленные нами, делают анонимность практически невозможной.

Тем не менее использование реальных имен на социальных платформах начало становиться нормой только с появлением Facebook. До этого обычно использовались псевдонимы. Отчасти это было обусловлено чисто техническими причинами. Некоторые имена распространены настолько широко, что в случае использования настоящих имен различать пользователей было бы невозможно; кроме того, некоторые сайты не принимали имена с большим количеством букв. В то же время были люди, осознанно не желавшие раскрывать имя, опасаясь хищений личных данных или неприятностей в связи со своими высказываниями, не совпадающими с общепринятым мнением. Так или иначе, но при желании можно было создавать разные имена пользователей или даже несколько для каждого сервиса или интернет-форума. В результате в первые десятилетия существования интернет предоставлял неслыханные ранее возможности для фрагментирования собственной персоны. А различные псевдонимы позволяли человеку исследовать новые способы взаимодействия с окружающими.

Исторически человека идентифицировали по ряду простых признаков, вроде имени, даты рождения, роста, цвета глаз, национальности и места жительства. Эта базовая информация использовалась для подтверждения того, что человек действительно тот, кем он представляется. Возможность подтвердить личность – необходимое условие выполнения многих законов и правил. Веками для доказательства права на посещение территорий использовались паспорта[109]109
  Формат паспортов стран был стандартизирован лишь вскоре после Первой мировой войны, но сама идея государственного документа, удостоверяющего личность путешественника, значительно старше – слово «паспорт» появилось в английском языке около 1540 года. См. Benedictus, Leo, “A Brief History of the Passport: From a Royal Letter to a Microchip”, Guardian, November 17, 2006, http://www.theguardian.com/travel/2006/nov/17/travelnews.


[Закрыть]
, а чеки и гарантийные письма служили подтверждением того, что в каком-то далеком банке у нас есть средства, достаточные для оплаты покупки[110]110
  Подлинность чеков требовалось удостоверить – на ранних этапах это делалось путем сличения подписи на чеке с оригиналом из банковского досье. См. Quinn, Stephen, and William Roberds, “The Evolution of the Check as a Means of Payment: A Historical Survey”, Economic Review 93, no. 4 (December 2008), https://www.frbatlanta.org/-/media/Documents/research/publications/economic-review/2008/vol93no4_quinn_roberds.pdf.


[Закрыть]
. Возраст или гражданство предоставляют определенные права и обязанности по отношению к обществу, например избирательное право или право употреблять алкоголь в общественных местах, или обязанность платить налоги, или нести воинскую повинность. Мы приучены к тому, что в огромном количестве жизненных ситуаций необходимо предъявить официальное удостоверение личности или сообщить его номер, ввести пароль или ответить на ряд вопросов, диапазон которых – от количества часов, проводимых в авиаперелетах, до домашних животных, которые были у нас в детстве.

Многие из оставляемых вами цифровых следов создаются через взаимодействие с физическими устройствами, и в этом взаимодействии есть немало характерных особенностей, позволяющих вас идентифицировать. Поскольку для выхода в интернет все чаще используются мобильные телефоны и планшеты, многие инфопереработчики вкладывают значительные ресурсы в исследования возможностей идентификации личности на основе устойчивых особенностей поведения при использовании разных устройств. Самым простым способом является требование регистрации пользователя, однако существуют более тонкие признаки, например установленные шрифты. Кроме того, многим людям свойственно постоянно делать одни и те же опечатки. Эта особенность также может быть установлена.

Оставляет след и само физическое взаимодействие с устройством. Сооснователь израильской компании BioCatch Ури Ривнер считает, что цифровые «отпечатки пальцев», то есть манера пользователя работать с компьютером, планшетом или мобильным телефоном, являются «одним из способов опознания личности»[111]111
  Цитируется по: Leber, Jessica, “Forget Passwords: This Startup Wants to Authenticate Your Mind”, Fast Company Exist, July 24, 2014, http://www.fastcoexist.com/3033383/forget-passwords-this-startup-wants-to-authenticate-your-mind.


[Закрыть]
. BioCatch создает свою коллекцию данных, заставляя не догадывающихся об этом пользователей выполнять действия, подтверждающие их личности. Компанию не интересует, что именно вы ищете, зато ее интересует, как вы это делаете. Вы бодро ударяете по тачскрину или мягко пошлепываете по нему? Насколько сильно дрожит ваша рука с мобильным телефоном? Где именно на экране вы указываете прокрутку вверх или вниз? Как быстро вы двигаете мышкой? Предпочитаете открывать новые вкладки через ссылки или перемещаетесь между несколькими вкладками? В числе заказчиков BioCatch – банки, которым требуются дополнительные способы аутентификации клиентов[112]112
  O’Hear, Steve, “Pre-Crime Startup BioCatch Authenticates Users via Touch and Your Phone’s Accelerometer”, TechCrunch, July 7, 2015, http://techcrunch.com/2015/07/07/pre-crime-startup-biocatch-authenticates-users-via-touch-and-your-phones-accelerometer.


[Закрыть]
. Анализ данных в режиме реального времени может быть полезен для идентификации личности и в других случаях, например, когда документов недостаточно или нет при себе в данный момент.

Детские игровые сайты и приложения вызывают целый ряд вопросов – от безопасности пользователя до адекватности контента. Самый простой пример – сайт, предлагающий игры для пользователей в возрасте от шести до шестнадцати лет, должен обеспечить правильное предложение для игроков соответствующего возраста. При этом разработчиков игр не слишком заботит, что восьмилетний ребенок может начать игру, предназначенную для подростков, – считается, что слишком трудная игра ребенка быстро разочарует, а слишком простая так же быстро ему наскучит. Ориентироваться на введенные регистрационные данные сайт не может, поскольку ребенок имеет возможность зайти на сайт с компьютера, которым пользуется кто-то из других членов семьи. Поэтому для оценки возраста пользователя сайты анализируют его взаимодействие с игрой. Часто для обеспечения безопасности в чатах игроков им оставляют только возможность использовать набор готовых фраз – это позволяет избежать риска неумышленного предоставления ребенком домашнего адреса или другой важной информации взрослому, изображающему ребенка. Оказалось, что дети старшего возраста используют другие, чем малыши, готовые фразы. Кроме того, системы игровых сайтов могут определять возраст ребенка с точностью до трех-шести месяцев по характеру движений мышью, которые тесно коррелируют с уровнем развития мелкой моторики, различной в разных возрастах[113]113
  Рост моторных навыков ребенка останавливается примерно в тринадцатилетнем возрасте (беседа автора с Лэйном Меррифилдом – генеральным директором FreshGrade и сооснователем Club Penguin, 21 января 2016 года). После приобретения Club Penguin компанией Disney в 2007 году Лэйн стал исполнительным вице-президентом интернет-подразделения этой медийной компании, а сейчас занимается над образовательным технологическим стартапом FreshGrade.


[Закрыть]
.



скачать книгу бесплатно

страницы: 1 2 3 4 5 6 7 8 9