Читать книгу Мир-фильтр. Как алгоритмы уплощают культуру (Кайл Чейка) онлайн бесплатно на Bookz (3-ая страница книги)
bannerbanner
Мир-фильтр. Как алгоритмы уплощают культуру
Мир-фильтр. Как алгоритмы уплощают культуру
Оценить:
Мир-фильтр. Как алгоритмы уплощают культуру

4

Полная версия:

Мир-фильтр. Как алгоритмы уплощают культуру

Социальная фильтрация информации позволяет обойти эти проблемы, поскольку основана на действиях людей-пользователей, которые самостоятельно оценивают содержание, используя как количественные, так и качественные суждения. Это больше похоже на сарафанное радио, когда мы получаем советы, что послушать или посмотреть, от друзей, чьи предпочтения схожи с нашими собственными: “Объекты рекомендуются пользователю на основе величин, присвоенных другими людьми со сходным вкусом”, – говорилось в статье. Сходство вкусов одного пользователя с другим определялось с помощью статистической корреляции. Чтобы давать музыкальные рекомендации, исследователи разработали систему под названием Ringo, использующую электронную почту. Пользователю предлагали первоначальную группу из 125 исполнителей, он выставлял оценки по шкале от 1 до 7, после чего строилась диаграмма его предпочтений. Затем программа сравнивала эту диаграмму с диаграммами других пользователей и подбирала музыку, которая человеку предположительно понравится (или совсем не понравится – такой вариант тоже был). Рекомендации Ringo также сопровождались указателем уровня уверенности, который выдавал вероятность того, что предложение окажется удачным, и позволял пользователю дополнительно подумать над предложенным алгоритмическим выбором. К сентябрю 1994 года у Ringo были двадцать одна сотня пользователей и пятьсот электронных писем в день с оценками музыки.

Ringo тестировала различные алгоритмы для принятия решений на основе музыкальных рейтингов. Первый алгоритм измерял несходство между вкусами пользователей и основывал рекомендации на максимальном сходстве. Второй измерял сходство, а затем использовал для принятия решений положительные и отрицательные корреляции с другими пользователями. Третий определял корреляцию между различными исполнителями и рекомендовал музыкантов, которые сильно коррелировали с теми, что уже нравились данному человеку. Четвертый алгоритм (по мнению исследователей, самый эффективный) подбирал пользователей на основе того, положительно или отрицательно они оценивали одни и те же вещи – иными словами, на основе совпадения вкусов. Сходство оказалось наилучшей переменной. Чем больше пользователей включалось в систему и чем больше сведений они предоставляли, тем лучше работала Ringo – некоторые пользователи даже назвали систему “пугающе точной”. Инновация Ringo заключалась в том, что она подтверждала: наилучшим источником точных рекомендаций или лучших индикаторов релевантности, скорее всего, являются другие люди, а не анализ самого содержания. Концепция отражала повышение важности человеческого вкуса.

Первые алгоритмы интернета разработали для того, чтобы просеивать огромное количество материала в поисках вещей, важных для пользователя, и затем представлять их в связном виде. Целью были рекомендации: рекомендовать ту или иную информацию, песню, картинку или новость в социальных сетях. Алгоритмическую подачу информации иногда более формально и буквально называют “рекомендательными системами” за простой акт выбора того или иного контента.

Первым полностью общедоступным интернет-алгоритмом, с которым сталкивался практически каждый пользователь интернета, стал алгоритм поиска Google. В 1996 году, учась в Стэнфордском университете, соучредители Google Сергей Брин и Ларри Пейдж начали работу над тем, что впоследствии превратилось в PageRank – систему ранжирования страниц интернета (который на тот момент насчитывал около ста миллионов документов); она просматривала веб-страницы и определяла, какие из них окажутся полезнее или информативнее. Алгоритм PageRank подсчитывал, сколько раз на данный сайт ссылались другие, подобно тому, как авторы научных работ ссылаются на результаты предыдущих серьезных исследований. Чем больше ссылок, тем более важной считалась страница. Показатель цитирования “согласуется с субъективным представлением людей о важности”, – писали Брин и Пейдж в 1998 году в работе “Анатомия системы крупномасштабного гипертекстового интернет-поиска”. Алгоритм PageRank объединил форму совместной фильтрации с фильтрацией на основе содержания. Связывая различные страницы, люди-пользователи формировали субъективную карту рекомендаций, которую учитывал алгоритм. Он также измерял такие факторы, как количество ссылок на странице, относительное качество этих ссылок и даже размер текста – чем он длиннее, тем более релевантным может оказаться текст для конкретного поискового запроса. Страницы с высоким значением PageRank с большей вероятностью появлялись в верхней части списка результатов, которые выдавала поисковая система Google.

Прогноз Пейджа и Брина относительно того, что их система останется функциональной и масштабируемой по мере развития интернета, оказался верным. Спустя десятилетия PageRank стал почти тиранической системой, которая управляет тем, как и когда видны сайты. Для любого бизнеса или ресурса жизненно важно приспособиться к алгоритму ранжирования и попасть на первую страницу результатов поиска Google. В начале 2000-х годов мне приходилось просматривать множество выдаваемых страниц, чтобы найти то, что мне требовалось. В последнее время я почти никогда не добираюсь даже до второй страницы – в частности, благодаря тому, что поисковая система Google теперь еще и сама показывает текст, который сочла релевантным: она берет его с сайта и демонстрирует пользователю в верхней части страницы – выше фактических результатов поиска. Таким образом, пользователь, спросивший: “Можно ли кормить собаку морковью?” (я без устали искал ответ на этот вопрос, когда у меня впервые появился щенок), сразу получает ответ, и у него отпадает необходимость заходить на другой сайт, что еще сильнее укрепляет авторитет Google. “Знание – сила”, – писал Фрэнсис Бэкон в XVI веке, однако в эпоху интернета, возможно, еще больше преимуществ дает сортировка знаний. Информацию сегодня найти легко; гораздо сложнее разобраться в ней и понять, какие сведения полезны.

Пейдж и Брин хотели, чтобы их система была относительно нейтральной и оценивала каждый сайт исключительно с точки зрения его релевантности. Задача алгоритма заключалась в предоставлении пользователю наилучшей информации. Ориентирование поиска на определенный сайт или бизнес испортило бы результаты. “Мы полагаем, что поисковые системы, финансируемые за счет рекламы, будут по своей сути отдавать предпочтение рекламодателям и не учитывать нужды потребителей”, – писали предприниматели в 1998 году. И тем не менее в 2000 году они запустили Google AdWords – пилотный продукт компании для рекламодателей (сейчас он называется Google Ads). Забавно читать их критику сегодня, когда именно реклама обеспечивает подавляющую часть доходов компании – более 80 % в 2020 году. Поскольку алгоритм PageRank привел в поисковую систему Google миллиарды людей, компания также получила возможность отслеживать, что ищут пользователи, и таким образом продавать рекламодателям позиции в выдаче при определенных поисковых запросах. Как и результаты поиска, рекламные объявления, показываемые пользователю, тоже определяются алгоритмом. И эта реклама, построенная на поисковом алгоритме, сделала Google настоящим левиафаном.

К началу 2000-х годов наш цифровой опыт уже определялся алгоритмической фильтрацией. Сайт Amazon еще в 1998 году начал использовать совместную фильтрацию при рекомендациях товаров клиентам. Однако система компании не пыталась обнаруживать сходные профили пользователей, чтобы приблизительно оценивать вкусы, как это делала Ringo; она определяла товары, которые часто покупают вместе, – например, погремушка и детская бутылочка. Статья 2017 года, созданная одним из сотрудников Amazon, описывает подобные предложения на сайте:

На главной странице выделялись рекомендации, основанные на ваших прошлых покупках и просмотренных товарах… Корзина рекомендовала добавить другие товары – возможно, спонтанные покупки, которые делаются в последнюю минуту, а возможно, дополнения к тому, что вы уже рассматривали. По окончании заказа появлялись дополнительные рекомендации, предлагающие заказать товары позже.

Такие алгоритмические рекомендации напоминают полки, расположенные непосредственно перед кассой в супермаркетах, – последний стимул купить товары, которые могут вам пригодиться. Но в данном случае рекомендации подбирались индивидуально для каждого пользователя сайта, и в результате, как утверждала статья, получался “магазин для каждого покупателя”. Amazon обнаружила, что персонализированные рекомендации товаров гораздо эффективнее с точки зрения количества кликов и продаж, чем неперсонализированные методы маркетинга – например, реклама на баннерах и списки наиболее популярных товаров, которые нельзя нацелить столь же точно. Алгоритм рекомендаций продвигал бизнес и оказался удобен для покупателя, который получил возможность находить вещи, о необходимости которых даже не подозревал. (Прямо сейчас главная страница Amazon рекомендует мне мойку с аккумуляторным питанием и японскую сковороду для омлета.)

Первые подобные алгоритмы сортировали отдельные электронные письма, музыкантов (в отличие от конкретных песен), веб-страницы и коммерческие товары. По мере развития цифровых платформ рекомендательные системы переместились в более сложные области культуры и стали оперировать гораздо большими скоростями и объемами, обрабатывая миллионы твитов, фильмов, загруженных пользователями видеороликов и даже потенциальных партнеров на свиданиях. Фильтрация стала стандартным способом работы в интернете.

Эта история напоминает также о том, что рекомендательные системы – это не всезнающие сущности, а инструменты, созданные группами технических специалистов. Они могут ошибаться. Ник Сивер – социолог и профессор Университета Тафтса, изучающий рекомендательные системы. Его исследования посвящены человеческой стороне алгоритмов – тому, что думают об алгоритмических рекомендациях создающие их инженеры. В наших беседах Сивер всегда старался прояснить двусмысленную суть алгоритма, отделяя индивидуальное уравнение от корпоративных мотивов, лежащих в основе его разработки, и конечного воздействия на пользователя. “Алгоритм – это метонимическое обозначение для компаний в целом, – говорил он мне. – Алгоритма Фейсбука не существует; существует Фейсбук. Алгоритм – это способ рассказать о решениях Фейсбука”.

Речь здесь не о технологии – нельзя обвинять сам алгоритм в плохих рекомендациях, как нельзя обвинять мост в его инженерных недостатках. Чтобы огромные хранилища контента на цифровых платформах стали доступными, необходима определенная степень упорядочивания. Негативные аспекты Мира-фильтра, возможно, возникли потому, что технология применяется слишком широко, учитывая скорее интересы рекламодателей, нежели опыт пользователей. Рекомендации в том виде, в котором они сейчас существуют, больше не работают для нас; они вызывают у нас все большее отчуждение.

Первые социальные сети

Мои первые значимые воспоминания о социальных сетях связаны с Фейсбуком, в котором я зарегистрировался после того, как поступил в колледж при Университете Тафтса. Дело было летом 2006 года, и в то время потенциальным пользователям требовался официальный адрес электронной почты в домене. edu, чтобы получить доступ к части платформы, которая относилась к колледжам. Тот первый вариант Фейсбука почти неузнаваем по сравнению с сегодняшней структурой. Аудитория строго ограничивалась; я использовал сеть в основном как средство связи с другими студентами университета. Если сегодня Фейсбук можно сравнить с лихорадочной трассой с выездами и заездами через каждые несколько секунд, то в нулевые годы он больше напоминал школьную комнату отдыха, где одновременно могли общаться лишь несколько человек. Вы создавали профиль, обновляли свой статус в нем, вступали в группы по общим интересам – но не более того.

Фейсбук стал едва ли не первым способом социального общения в интернете. Его предшественниками были Friendster и MySpace. Сервисы обмена сообщениями – Instant Messenger компании AOL и gChat компании Google – обеспечивали увлекательные способы общения с друзьями в режиме реального времени. К 2006 году я уже провел сотни часов на более старых форумах, где обсуждались видеоигры и музыка. Однако именно Фейсбук Цукерберга первым грамотно и последовательно связал онлайн-идентичность с офлайновым миром. Платформа поощряла пользователей использовать свои настоящие имена, а не таинственные псевдонимы, и влияла на реальные планы в маленьком мире колледжа: организацию вечеринок, планирование учебной деятельности и завязывание отношений. Тем самым она проложила путь к распространению социальной жизни в интернете для миллионов, а затем и миллиардов пользователей.

В сентябре 2006 года, вскоре после моего появления в Фейсбуке, там появилось одно из крупнейших нововведений – функция, которая определила его будущее в качестве онлайн-гипермаркета, торгующего всем подряд. Главным атрибутом платформы стала лента новостей, бегущий список обновлений, постов и оповещений. Ею нельзя было пренебречь – как только что построенным шоссе, прорезавшим тихую деревню. “Теперь всякий раз, когда вы входите в систему, вы получаете последние новости, связанные с активностью ваших друзей и социальных групп”, – сообщалось в официальном обновлении Фейсбука.

Патент на ленту новостей, поданный в том же году, но полученный только в 2012-м, описывал ее назначение: “Система и метод предоставляют динамически выбранный медиаконтент человеку, использующему электронное устройство в среде социальной сети”. Иными словами, лента новостей представляла собой поток информации, продиктованный алгоритмом, который определял, что именно показывать пользователю. В другом патенте была заявлена возможность “генерировать динамический контент, основанный на взаимоотношениях и персонализированный для участников социальной сети на веб-основе”. Сначала эта лента новостей представляла собой просто поток уведомлений об изменении статуса отношений и новых фотографий в профиле. Это не вызывало особых подозрений.

Более полное описание патентной заявки на ленту новостей говорит о системе совместной фильтрации, действующей в гораздо больших масштабах, нежели системы электронной почты 1990-х годов. Его стоит процитировать полностью, потому что оно предсказывает, во что превратится в следующем десятилетии большая часть онлайн-жизни (от социальных сетей до потоковой передачи данных и электронной торговли): множество автоматизированных лент, диктуемых в большей степени корпорациями, а не пользователями, которые постепенно формируют более пассивные отношения между пользователями и подачей контента.

Элементы медиаконтента выбираются для пользователя на основе его отношений с одним или несколькими другими пользователями. Эти отношения пользователя с другими пользователями отражаются в выбранном медиаконтенте и его формате. Элементам медиаконтента присваивается некоторый порядок (например, на основе их предполагаемой важности для пользователя), и именно в этом порядке их представляют пользователю. Пользователь может изменить порядок элементов медиаконтента. Взаимодействие пользователя с медиаконтентом, доступным в среде социальной сети, отслеживается, и это взаимодействие используется для выбора дополнительных элементов медиаконтента для пользователя.

Этот фрагмент содержит все элементы алгоритмической ленты – системы, которая прогнозирует относительную важность информации для конкретного пользователя, определяемую на основе наблюдения за контентом, который он просматривал в прошлом; затем система продвигает в начало списка тот контент, который, на ее взгляд, с максимальной вероятностью будет столь же интересен. Цель – отфильтровать контент, чтобы выбрать наиболее вовлекающий. Это побуждает пользователя потреблять больше информации и подписываться на большее количество аккаунтов в целом. Социальные сети обрели жизнеспособность, поскольку пользователи могли чаще пользоваться ими и дольше оставаться на сайтах. Если наши друзья не активны в Фейсбуке (у меня, например, как раз такой случай), то и мы, скорее всего, снизим свою активность.

Сначала ленту новостей упорядочивали исключительно в хронологическом порядке, и на первом месте находились самые свежие обновления; однако постепенно она стала подчиняться более алгоритмической логике. По мере развития Фейсбука и увеличения активности пользователей, которые добавляли все больше связей, переходя от личных отношений к публикациям и брендам, объем отдельных обновлений увеличивался. Со временем обычные заметки от друзей дополнились сообщениями от групп, ссылками на новости и объявлениями о распродажах. Обычные пользователи уже не могли рассчитывать, что им удастся следить за хронологической лентой при таком объеме и разнообразии сообщений, но даже если бы попытались, то их либо завалило бы информацией, либо они пропустили бы важное сообщение – что могло вызвать недовольство платформой. В конце концов масштаб и скорость потребления в Фейсбуке привели к тому, что агрессивная алгоритмическая фильтрация стала необходимой.

В 2009 году в Фейсбуке появилась кнопка Like в виде поднятого большого пальца; она стала показывать, насколько пользователю интересен тот или иной контент. Порядок в ленте определяла вовлеченность пользователей, измеряемая лайками, комментариями и предыдущими взаимодействиями аккаунтов между собой. Эта алгоритмическая система получила название EdgeRank, и Фейсбук определил ее основные параметры: совместимость, вес действий и время. Под действием понималось любая деятельность людей в Фейсбуке, которая затем отправляется в ленту новостей в виде фиксируемого обновления. Совместимость отражала степень связи пользователя с автором поста и силу этой связи (например, постоянное комментирование постов друзей). Комментарий оценивался выше, чем лайк, а недавние взаимодействия – выше, чем старые. Показатель веса оценивал различные категории взаимодействий: обновление у друга, разместившего новую фотографию, могло иметь больший вес для алгоритма, нежели размещение ссылки на новость или вступление в новую группу. Время отражало возраст действий: при прочих равных условиях недавние действия с большей вероятностью оказывались в верхней части ленты новостей, нежели старые. Показатель EdgeRank не оставался вечным, как результат баскетбольного матча в турнире; он постоянно менялся. И эти три категории – не просто отдельные, нейтральные единицы данных; это совокупность данных, упакованных и интерпретированных Фейсбуком особым образом.

Отследить эволюцию алгоритмической ленты Фейсбука сложно, поскольку она постоянно обновляется, а компания раскрывает подробности лишь время от времени. Все, что мы знаем о ней помимо официальных заявлений, сводится к журналистским расследованиям и опыту пользователей, которые ощущают эффекты обновленных алгоритмов задолго до того, как те становятся достоянием общественности. Когда меняется механизм подачи информации, знакомые веб-сайты могут начать восприниматься иначе. Например, вы обнаруживаете, что реже видите в Фейсбуке сообщения своих друзей и чаще – посты групп или компаний или что Инстаграм никогда не показывает в вашей ленте посты определенного друга, и вам приходится искать их с помощью поиска.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

Notes

1

Примерно 120 × 75 × 90 см. (Здесь и далее, если не указано иное, – прим. перев.)

2

В основании каждой фигуры располагался магнит. Кроме того, к каждому полю снизу крепилась нить с металлическим шариком. Если фигура стояла на поле, шарик притягивался к нему снизу. Если фигуру поднимали, шарик опускался. Таким образом спрятанный шахматист видел ходы на доске.

3

Отверстия вели к тюрбану, и выходивший из тюрбана дымок смешивался с дымом от других свечей, освещавших помещение.

4

Публикации, раскрывавшие секрет, появлялись и раньше.

5

Деятельность компании Meta Inc (Facebook, Instagram) решением российского суда признана экстремистской и запрещена на территории России. (Прим. ред.)

6

Ныне X. (Прим. ред.)

7

Предполагается, что продвигать песню в жанре кантри проще, чем в хип-хопе.

8

От stream (“поток”) и bait (“наживка”).

9

Этот алгоритм был известен и до Евклида.

10

Несмотря на распространенность этой теории, в действительности яблоко не проверяли на наличие яда.

11

Слово Cybersyn образовано от cybernetics (“кибернетика”) и synergy (“синергия”, то есть усиление суммарного воздействия по сравнению с воздействием отдельных факторов).

12

Система “Киберсин” все же успела поработать, но после прихода к власти Пиночета ее забросили.

13

Здесь и далее цитаты даны по изданию: Маклюэн М. Понимание медиа: внешние расширения человека. М.: Кучково поле, 2007. Перевод В. Николаева.

Вы ознакомились с фрагментом книги.

Для бесплатного чтения открыта только часть текста.

Приобретайте полный текст книги у нашего партнера:


Полная версия книги

Всего 10 форматов

bannerbanner