
Полная версия:
Пропагандистский дискурс в условиях цифровизации
В настоящее время широко цитируемым остается определение Департамента обороны США: стратегические коммуникации – это «целенаправленные действия правительства США для понимания и вовлечения ключевых целевых аудиторий в создание, укрепление или сохранение благоприятных условий для расширения интересов, политик и задач США через реализацию скоординированных программ, планов, тем, ключевых сообщений и синхронизированных продуктов с использованием всех инструментов государственной власти»[124].
Таким образом, речь идет о синхронизации инструментов национального влияния (дипломатия, информация, вооруженные силы, экономика), а также о взаимопроникновении коммуникаций в нетрадиционные для нее области и нетрадиционных областей – в коммуникации. Стратегические коммуникации – это процесс, который включает не только коммуникаторов, но и игроков из других сфер деятельности организации.
Стратегические коммуникации используются для того, чтобы информировать, влиять и убеждать зарубежные аудитории и общественность[125]. К компонентам стратегических коммуникаций, с точки зрения американских военных аналитиков, относятся информационные операции, психологические операции, публичная дипломатия и общественно-политические коммуникации (public affairs).
Подход Европейского союза. Чтобы представить подход Европейского союза к пониманию стратегических коммуникаций, воспользуемся прежде всего данными доклада, который подготовил Институт исследований безопасности Европейского союза (European Union Institute for Security Studies, EUISS) во Франции по заказу Европейского парламента[126].
Европейский парламент дает очень простое и понятное определение: стратегические коммуникации – это коммуникативная деятельность в соответствии с повесткой дня или планом. «Область “коммуникаций” широка, она охватывает отдельных лиц и организации, которые создают новости или продвигают информацию (фирмы по связям с общественностью, вещательные компании), которые предоставляют новости и СМИ (журналисты), а также изучают взаимодействие между медиа и обществом (исследователи). В качестве зонтичного термина “стратегические” коммуникации объединяют их всех»[127].
Европейские исследователи используют также определение, предложенное в 2011 г. в докладе Chatham House*, в котором стратегические коммуникации описываются как «систематическая серия устойчивых и последовательных мероприятий, проводимых на стратегическом, оперативном и тактическом уровнях, что позволяет понимать целевые аудитории и определять эффективные каналы для продвижения и поддержки конкретных типов поведения»[128]. В качестве компонентов стратегических коммуникаций выделяются элементы публичной дипломатии медиарилейшнз, реклама. Указывается, что термин «стратегические коммуникации» близок к термину «гибридная война» и часто ассоциируется с войной, тактикой, угрозами[129].
Подчеркнем, что в большинстве документов Европейского союза термин «стратегические коммуникации» употребляется в контексте пропаганды и практик дезинформации[130]. Причем в документах Европейского союза прослеживается различное понимание терминов «пропаганда» и «дезинформация»: пропаганда – целенаправленное распространение информации и идей, дезинформация – систематический и преднамеренный обман[131]. В тех же документах отмечается, что «НАТО, кажется, использует “пропаганду” и “дезинформацию” как взаимозаменяемые»[132]. На сегодняшний же день внешние коммуникации и общественная дипломатия стали ключевым приоритетом Европейского союза. Согласно Плану действий по стратегической коммуникации (Teh Action Plan on Strategic Communication), представленному Европейским союзом в июне 2015 г., предполагается поддерживать свободу выражения мнений, развивать инициативы публичной дипломатии, инвестировать в образование, медиа, расследовательский журнализм и различные социальные институты с целью обучить граждан правильно анализировать прессу, чтобы противостоять пропаганде[133].
Российский подход. В России до сих пор не сложилось единого и общепринятого понимания как стратегических коммуникаций, так и пропаганды.
В середине 2000-х годов стратегические коммуникации изучались учеными, представляющими Петербургскую школу паблик рилейшнз (прежде всего профессором И. П. Яковлевым), однако эти исследования касались в основном коммуникаций в бизнес-среде. Современное состояние теории и практики публичных коммуникаций вызвало новый всплеск интереса к данной теме[134], что стало и ответом на реальные коммуникационные вызовы, и итогом исследовательской деятельности российских ученых: В. Ачкасовой, Д. Гавры, М. Грачева, Е. Егоровой-Гартман, С. Емельянова, Г. Мельник, Е. Пашенцева, О. Филатовой и др.
Так, например, в работах Д. Гавры акцент делается на стратегических коммуникациях в бизнесе[135]. М. Грачев выделяет основные характеристики стратегических коммуникационных кампаний в политике[136]. E. Егорова-Гантман в целом разделяет американский, военно-стратегический подход, определяя стратегические коммуникации как комплекс мероприятий по согласованному информированию иностранных аудиторий о деятельности и взглядах правительства, а также направленных на продвижение и отстаивание национальных интересов в мире, побуждение другой стороны действовать в выгодном для государства направлении[137].
Следует упомянуть еще один близкий по значению термин – «информационное противоборство», используемый государственными структурами и военными аналитиками. Например, в 2017 г. министр обороны Сергей Шойгу сообщил, что для противоборства в информационной сфере в Вооруженных силах РФ созданы специальные войска информационных операций. По словам Сергея Шойгу, пропаганда должна быть умной, эффективной и грамотной[138].
Все представленные подходы к стратегическим коммуникациям можно свести к следующим положениям. Стратегические коммуникации – это скоординированные действия, сообщения, изображения и другие формы информирования, влияния или убеждения целевых аудиторий для достижения национальных целей. Стратегические коммуникации зависят от существующей стратегии, целевой аудитории и ее характеристик, доступных средств влияния и используемых нарративов. Основное содержание стратегических коммуникаций согласуется с целями стратегических коммуникаций, которые сами по себе носят стратегический характер. Результаты стратегических коммуникаций находят свое выражение в таких понятиях, как согласие, лояльность, доверие, гармония отношений, приверженность и т. п.[139]
В таком случае, используя коммуникационный подход, можно определить пропаганду как систематические стратегические коммуникации для управления восприятием, манипулирования сознанием и поведением целевой аудитории с целью получения нужного для пропагандиста результата.
Для целей настоящей монографии будет использоваться скорректированный вариант определения данного понятия: пропаганда – систематическое информационное влияние субъекта пропаганды на целевые аудитории для достижения заранее определенных целей.
Соответственно, политическая пропаганда – это скоординированное, систематическое информационное влияние субъекта пропаганды на целевые аудитории для достижения политических целей и продвижения политических идей.
В современных условиях усиливающегося информационного противостояния стратегические коммуникации выходят на первый план, так как государствам необходимо оградить своих граждан от различных информационных угроз, обеспечить их безопасность, что является обязательным условием для дальнейшего развития государства. Инструменты и мероприятия, направленные на то, чтобы аннулировать пропаганду или смягчить ее последствия, мы определяем как контрпропаганду. Подобным образом контрпропаганда определяется и в документах НАТО[140].
В целом проведенные нами исследования показывают, что НАТО и Европейский союз начиная с 2014 г. серьезно занимаются проблемами пропаганды и контрпропаганды, разрабатывают специальные проекты и проводят прикладные исследования в данном направлении.
2.2. Специальные проекты НАТО и Европейского союза
В 2014 г. начал функционировать Центр передового опыта стратегических коммуникаций НАТО (NATO Strategic Communications Centre of Excellence, NATO StratCom COE). Центр является аккредитованной НАТО международной военной организацией, которая не входит в состав командования НАТО и не подчиняется ни одному другому подразделению НАТО. Как указано на сайте организации, миссия NATO StratCom COE состоит в том, чтобы способствовать коммуникационным процессам Североатлантического союза, предоставляя ему всесторонний анализ, своевременные консультации и практическую поддержку. Например, интересными, но требующими дальнейшей верификации и объяснения можно считать, например, исследования так называемого роботизированного троллинга, которые осуществляет NATO StratCom COE. Роботизированный троллинг, или роботтроллинг, – это скоординированное использование фейковых аккаунтов и записей в социальных сетях[141].
Американский аналитический центр Atlantic Council* запустил проект Digital Forensic Research Lab[142]. Исследования того, как боты в социальных медиа используются для управления общественным мнением в разных странах, осуществляются в рамках проекта «Teh Computational Propaganda Research Project (COMPROP)» Оксфордского университета[143]. Развивая мысль об идентификации ботов, троллей и фейк-ньюз, перечислим также ряд современных технологических инструментов и проектов, позволяющих выявлять цифровую дезинформацию в Twitter: Hamilton 68[144], Botometer[145], Debot[146]. Существует и много других подобного рода проектов. Помогают своим пользователям идентифицировать фейк-ньюз также Facebook*, Google[147] и другие IT-компании. Например, Facebook* и Instagram* удалили 120 тысяч постов, связанных с президентскими выборами в США в ноябре 2020 г., не дали опубликовать 2,2 миллиона рекламных объявлений, разместив 150 миллионов предупреждений в отношении постов с дезинформацией[148].
В Европейском союзе разработкой коммуникационных материалов и кампаний, разъясняющих политику Европейского союза и противодействующих дезинформации, в соответствии с уже упоминавшимся Планом действий в области стратегических коммуникаций, призвана заниматься Оперативная рабочая группа по стратегическим коммуникациям (East StratCom Task Force), созданная решением глав государств и правительств Европейского союза в марте 2015 г. В рамках кампании «ЕС против дезинформации» Оперативная рабочая группа разработала портал EUvsDisinfo[149], новая версия которого запущена в сентябре 2017 г. В конце 2017 г. Европейская комиссия создала группу экспертов высшего уровня для консультирования по вопросу противодействия фейк-ньюз, которая начала широкомасштабный процесс консультаций с общественностью, включающий онлайн-опросы, структурированные диалоги с соответствующими заинтересованными сторонами и опрос общественного мнения «Евробарометр», охватывающий все 28 государств – членов Европейского союза. Итоги консультаций с общественностью по поводу фейк-ньюз и цифровой дезинформации были представлены в марте 2018 г. в специальном докладе[150].
Европейский центр передового опыта противостояния гибридным угрозам (Teh European Centre of Excellence for Countering Hybrid Threats) начал функционировать в июле 2017 г. Судя по информации на сайте центра, его цель заключается в содействии общему пониманию гибридных угроз на стратегическом уровне и разработке всеобъемлющих ответных мер на национальном уровне, а также скоординированных ответных мер на уровнях Европейского союза и НАТО.
Нельзя не заметить, что большинство прикладных исследований Европейского союза и НАТО посвящены России. Европейские и американские исследователи четко выявляют источники, каналы, аудиторию российского воздействия, анализируют ключевые нарративы стратегических коммуникаций[151]. В частности, европейские исследователи считают, что «российские стратегические коммуникации содержат мета- или гранднарративы, то есть серию ключевых тем, которые последовательно проявляются в большинстве коммуникационных событий… Ключевой месседж изображает Запад как образование, с одной стороны, агрессивное и экспансионистское, и с другой – как слабое и находящееся на грани коллапса. Европейский союз изображается как близкий к распаду под совместным давлением финансового и миграционного кризисов»[152].
К сожалению, мы не можем утверждать, судя по открытым источникам, что подобные проекты существуют и в России. Укажем лишь, что на сайте МИД РФ создана специальная вкладка с примерами публикаций, тиражирующих недостоверную информацию о России[153]. И можно отметить деятельность нескольких групп инициативных граждан – например, «Наблюдатели» собирают базу данных из профилей пользователей на YouTube, которых относят к ботам.
В целом, на наш взгляд, основная проблема в изучении пропаганды и контрпропаганды на сегодняшний день заключается в том, что они принимают множество форм и распространяются по многим каналам. Коммуникации стремительно развиваются, и, хотя пропаганда имеет долгую историю, сегодня ее охват, масштаб и эффективность поднялись на беспрецедентный уровень благодаря вирусной скорости социальных сетей и возможностям искусственного интеллекта.
В настоящий момент можно выделить две эпохи в развитии пропаганды. Первую условно назовем эпохой классической пропаганды, а вторую (воспользовавшись терминологией Г. Почепцова) – эпохой «пропаганды 2.0», или «цифровой пропаганды». И если классическая пропаганда хорошо изучена, то есть выявлены ее виды, цели, каналы, аудитории, механизмы и принципы воздействия, построены модели ее изучения, то «пропаганды 2.0» еще ждет своих исследователей. Здесь, безусловно, большие возможности предоставляет искусственный интеллект: в частности, современные методы машинного обучения и автоматической обработки текстов необходимы для идентификации пропаганды. Представим далее результаты исследовательского проекта, ориентированного на применение искусственного интеллекта для выявления пропагандистского контента в текстах СМИ.
2.3. Идентификация пропагандистского контента на базе тематической модели корпуса текстов СМИ
В данном параграфе мы продемонстрируем возможности использования подхода, основанного на тематическом моделировании (topic modeling) для идентификации пропаганды в СМИ. Отметим, что, насколько нам известно, описанный подход для выявления столь семантически нечеткого явления, как пропаганда, предлагается впервые.
Данный инициативный исследовательский проект осуществлялся в апреле – июне 2020 г. международным коллективом, в который входили медиаэксперты О. Г. Филатова (Россия), Дж. М. Ионеску (Румыния) и группа исследователей из Казахстана под руководством профессора Р. И. Мухамедиева (основной исполнитель – К. О. Якунин). Опыт коллег из Казахстана, которые в течение последних лет выполнили серию проектов[154], ориентированных на применение систем искусственного интеллекта в различных прикладных областях исследований на стыке машинного обучения, обработки естественного языка и изучения социума, активно задействовался в рамках представленного ниже исследовательского проекта[155].
Как уже отмечалось, в данном проекте использовался подход по выявлению текстов с пропагандистским содержанием с применением тематической модели корпуса текстов.
Анализ больших объемов текстовой информации в настоящее время обеспечивается методами автоматической обработки естественных языков (natural language processing). Эти технологии позволяют пользователям собирать информацию из больших объемов текстовых данных[156], обеспечивают анализ контента[157], персонализированный доступ к новостям[158] и даже поддерживают их производство и распространение[159]. Впечатляющие результаты в области автоматической обработки естественных языков, согласно современным исследованиям[160], стали возможны благодаря достижениям в развитии методов машинного обучения, многократному увеличению вычислительной мощности, наличию большого объема лингвистических данных и развитию понимания структуры естественного языка в приложении к социальному контексту.
Проблема автоматической классификации текстов с пропагандистским содержанием рассматривается в ряде работ[161], однако количество публикаций по этой теме на порядок меньше, чем, например, количество исследований в области анализа тональности текстов (sentiment analysis). Объем размеченных по пропагандистскому содержанию корпусов (наборов данных для обучения моделей) также невелик. Так, в одной из публикаций[162] представлен подход, основанный на «мешке слов» (bag-of-words). Метод «мешка слов» учитывает лишь частоту встречаемости слов в документе вне зависимости от места расположения слова. Данный метод позволил классифицировать пропаганду на уровне отдельных предложений с показателем качества F1 Score – 0,6. F1 score, или гармоническая мера, объединяет ошибки первого и второго рода в процессе классификации. С некоторой долей условности можно считать, что метод правильно классифицирует пропаганду примерно в 60 % случаев.
Одним из методов, продуктивно применяемых в области обработки естественных языков, является тематический анализ, или тематическое моделирование. Тематическое моделирование – это метод, основанный на статистических характеристиках коллекций документов, который используется в задачах автоматического реферирования, извлечения информации, информационного поиска и классификации[163]. Смысл данного подхода заключается в интуитивном понимании того, что документы в коллекции образуют группы, в которых частота встречаемости слов или сочетаний слов различается. Основой современных тематических моделей является статистическая модель естественного языка. Вероятностные тематические модели описывают документы дискретным распределением на множестве тем, а темы – дискретным распределением на множестве терминов или слов[164]. Другими словами, тематическая модель определяет, к каким темам относится каждый документ и какие слова образуют каждую тему. Кластеры документов, относящихся к совокупности тем, формируемых в процессе тематического моделирования, в частности, позволяют решать задачи синонимии и полисемии терминов[165].
Предложенный нами подход отличается от существующих тем, что анализ происходит не на уровне отдельных предложений или слов, а на более высоком уровне абстракции – на уровне так называемых топиков (групп текстов, объединенных единой темой), к которым тексты могут иметь большее или меньшее отношение. При этом тексты, которые могут описывать и несколько тем, могут входить в несколько топиков одновременно с разным уровнем сопричастности. Однако данный подход требует корпуса текстов большого объема (как минимум сотни тысяч документов), а также явного свойства публикаций, по которому можно провести разделение корпуса (например, по источнику публикации).
Предложенная модель была разработана в связи с тем, что классический подход к классификации текстов предполагает наличие значительного объема размеченных вручную текстов из заданного корпуса, то есть в зависимости от подхода и корпуса может потребоваться от тысяч до сотен тысяч и даже миллионов размеченных вручную текстов. В то время как для анализа тональности и других более изученных задач используется большое количество размеченных корпусов достаточного объема из самых разных областей (посты в социальных сетях, отзывы и обзоры, комментарии и т. п.), существует также множество задач с явной нехваткой размеченных данных – к таким задачам как раз и относится идентификация пропаганды, а также, например, социальной значимости, резонансности (популярности) публикаций и т. д. Мы предложили модель, которая может успешно применяться даже при наличии минимального объема ручной разметки (в данном исследовании проводится разметка новостных источников) либо вообще без ручной разметки. Последний вариант возможен в случае, когда есть некое явное свойство публикаций, которое коррелирует с целевым (неявным) свойством. Например, если целевое свойство – это потенциальная популярность, то есть резонансность, публикации, его можно связать с объективными показателями вовлеченности пользователей: просмотры, комментарии, лайки, репосты.
Предложенная модель также может быть рассмотрена как альтернативный подход к использованию принципа transfer learning[166], поскольку она учитывает эффективное векторное представление (embedding), основываясь на большом объеме неразмеченных данных. Следовательно, даже те документы, которые невозможно отнести к определенному подкорпусу (или для которых явное свойство, например вовлеченность пользователей, неизвестно), все еще могут применяться на этапе тематического моделирования для получения более эффективных векторных представлений.
Предложенный метод состоит из четырех этапов:
1) формирование корпуса текстов и его разделение на подкорпусы с использованием некоего явного (объективного) свойства публикаций (для данной работы это новостной источник).
2) расчет тематической модели полного корпуса;
3) оценка меры межкорпусного тематического дисбаланса;
4) экстраполяция полученных оценок дисбаланса на все документы корпуса, включая те, для которых значение явного свойства (см. этап 1) неизвестно (например, когда уровень пропагандистского содержания новостного источника оценить затруднительно или он неизвестен).
Теперь остановимся на каждом этапе подробнее.
Этап 1. Формирование корпуса текстов. Мы сформировали корпус новостных публикаций из открытых русскоязычных новостных источников. Предложенный метод предполагает, что корпус должен быть разделен на два или более отдельных корпусов на основании некоего явного свойства (в данном случае новостной источник публикации) с целью выявить особенности, позволяющие определить некое неявное целевое свойство (в данном случае идентификации пропаганды в тексте публикации).
Для наиболее точного исследования мы решили проанализировать пропагандистские СМИ с явно субъективной риторикой и сравнить их с теми медиа, чья риторика является более объективной.
Русскоязычные СМИ в Российской Федерации на момент исследования были представлены государственными холдингами, контролирующими и курирующими деятельность данных СМИ, частными, или независимыми, СМИ (так называемыми оппозиционными, или либеральными, медиа) и иностранными СМИ публичной дипломатии, вещающими на русском языке, принадлежащими правительствам США, Великобритании, Германии и Франции, которые в России зарегистрированы в качестве иностранных агентов в соответствии с Федеральным законом от 02.12.2019 № 426-ФЗ «О внесении изменений в Закон Российской Федерации “О средствах массовой информации” и Федеральный закон “Об информации, информационных технологиях и о защите информации”». Существуют также два государственных средства массовой информации, Sputnik и RT, но из-за внутреннего регулирования их деятельности, их целевая аудитория – это не граждане России, а граждане стран СНГ.
Международные вещатели являются частью системы государственной публичной дипломатии, поэтому их риторика явно пропагандистская. Их цель – это продвижение имиджа и политических интересов государства в иностранном гражданском обществе. Поэтому мы решили проанализировать такие СМИ, как RT, Sputnik, «Радио Свобода»*, «Телеканал Настоящее время»* и Deutsche Welle*.
В качестве СМИ, имеющих более объективную риторику, мы решили исследовать такие СМИ, которые менее вовлечены в политическую жизнь страны и которые концентрируются на освещении бизнес-среды или экономики. Мы проанализировали одно нейтральное информагентство (Interfax), три бизнес-ориентированных СМИ (РБК, «Ведомости», Business FM) и одну интернет-газету (Lenta.ru).
Таким образом, исходя из соображений, изложенных выше, мы разделили корпус, состоящий из 428 180 публикаций за 2018–2020 гг., на два корпуса в зависимости от их типа и источника:
1) Пропагандистские публикации (346 440 публикаций):
а) RT;
б) «Телеканал Настоящее время»*;
в) «Радио Свобода»*;
г) Deutsche Welle*;
д) Sputnik;
2) Условно объективные публикации (81 740 публикаций):
а) «Ведомости»;
б) Interfax;
в) Lenta.ru;
г) Business FM;
д) РБК.
Этап 2. Тематическое моделирование. Для построения тематической модели корпуса документов применяют: вероятностный латентно-семантический анализ (probabilistic latent semantic analysis, PLSA), суммирующая регуляризация тематических моделей (additive regularization of topic models, ARTM)[167] и весьма популярное латентное размещение Дирихле (latent Dirichlet allocation, LDA)[168]. Последнее может быть выражено следующим равенством:

представляющим сумму смешанных условных распределений по всем темам множества T, где p(w|t) условное распределение слов в темах, p(t|m) условное распределение тем по новостям. Переход с условного распределения p(w|t,m) на p(w|t) осуществляется за счет гипотезы условной независимости, согласно которой появление слов в новостях m по теме t зависит от темы, но не зависит от новости m и есть общее для всех новостей. Данное соотношение справедливо, исходя из допущений об отсутствии необходимости сохранения порядка документов (новостей) в корпусе и порядка слов в новости; помимо этого, метод LDA предполагает, что компоненты φwt и θtm порождены непрерывным многомерным вероятностным распределением Дирихле. Целью алгоритма является поиск параметров φwt и θtm путем максимизации функции правдоподобия с соответствующей регуляризацией.



