Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

METHODOLOGY FOR ASSESSING INFORMATION RISKS OF RUSSIAN INTERNATIONAL MEGA PROJECTS OF NPP CONSTRUCTION ABROAD BASED ON THE ANALYSIS OF THEIR DIGITAL SHADOW

Guseva A.I. 1 Bochkarev P.V. 1 Koptelov M.V. 1 Kuznetsov I.A. 1
1 National Research Nuclear University MEPhI
This article is devoted to the development of a methodology for assessing information risks accompanying construction projects of Russian nuclear power plants abroad. The information risk index directly reflects the level of public acceptance of nuclear energy in the respective countries. The development of the methodology is ensured by analyzing a wider information spectrum of messages that circulate in the information-semantic field of the megaproject and accumulate in its digital shadow (on Internet servers, electronic media and social networks). In this case, consideration includes not only the tonality of electronic media publications in relation to the selected topic, but also the activity of Internet users and the presence of opinion leaders and influencers, as well as the tonality of posts in social networks. The study was conducted for the countries of Belarus, Hungary, Turkey and Finland for the period 2019-2021. At the first stage of the study, using the Google Trends application, the activity of Internet users in relation to the topic “nuclear energy” was determined for the region of the construction of the Russian nuclear power plant, neighboring and metropolitan regions for each of the four countries. At the second stage, electronic media news reports for each country were collected and preprocessed, and their sentiment was determined using CNN convolutional neural networks. At the third stage, using the method of double ensemble clustering with a changing distance metric, opinion leaders were identified and the tone of their statements was determined by expert means. Based on the data obtained, information risk indices were calculated for Belarus, Hungary, Turkey and Finland. At the fourth stage, for Belarus, the Russian-language segment of YouTube for 2019-2021 was analyzed, the most popular channels were identified, the videos of which were dedicated to nuclear power plants. The tonality of such videos is determined and influencers are highlighted. For Belarus, the information risk index was adjusted taking into account the tone of videos on social networks and the opinions of influencers.
mega-project for the construction of a nuclear power plant
information risk
information-semantic field
digital shadow
tonality of statements
influencers
opinion leaders

Общественная приемлемость атомной энергетики является одним из трех важнейших факторов реализации мегапроектов строительства объектов атомной генерации, влияющих на успешность таких проектов [1]. В целом приемлемость в обществе формируется путем воздействия на общественное мнение, которое является в данном случае индикатором состояния информационно-семантического поля проекта [2].

Для повышения общественной приемлемости атомных технологий разрабатывается программа лояльности. Действенность мероприятий такой программы лояльности в первую очередь определяется изменением информационно-семантического поля мегапроекта, которое оказывает существенное влияние на экономические показатели проекта [3]. Таким образом, в современных условиях возрастает значение информационных рисков, и термин «информационный риск» необходимо рассматривать именно в контексте информационных потоков, которые сопровождают проект строительства АЭС на всех этапах жизненного цикла и могут оказывать существенное влияние на реализацию проекта [3].

В данной статье для оценки индекса информационных рисков мы рассматриваем именно уровень общественной приемлемости мегапроекта, анализируя его цифровую тень, которая накапливается в информационно-семантическом поле мегапроекта. Ряд авторов сужают понятие информационного риска и подменяют его риском информационной безопасности [4]. В более широком смысле под информационным риском понимается возможность возникновения убытков или ущерба в результате применения информационных технологий [5]. В данной работе рассматривается социально-экономическая составляющая информационного риска, т.е. возможность влияния на ход реализации проекта путем воздействия на информационно-семантическое поле мегапроекта через информационные технологии [6]. Информационно-семантическое поле организации представляет собой пространство, состоящее из информационных потоков, доступных для анализа и управления, в которых группы потребителей услуг или продуктов, производимых организацией, передают и воспринимают сообщения и сведения о самой организации, ее репутации, о продуктах или оказываемых услугах [7, 8]. Эти сообщения накапливаются на интернет-серверах, электронных СМИ, социальных сетях и т.д. и формируют цифровую тень мегапроекта [3, 9]. Подвергая анализу эту информацию, можно определить установки потребителей мегапроекта, что и отражает уровень общественной приемлемости [10, 11].

Целью данного исследования является развитие метода пофакторной оценки индекса информационных рисков российских мегапроектов строительства АЭС за рубежом и ее апробация в Белоруссии, Венгрии, Турции и Финляндии.

Материалы и методы исследования

Ранее авторами данной статьи была разработана методика, позволяющая оценить индексы информационных рисков с учетом тональности сообщений электронных СМИ [5].

В данной работе для оценки информационного риска мегапроекта сооружения АЭС за рубежом предлагается подход, использующий рейтинг ISMI (Integrum Social Media Influence), который опирается на такие характеристики, как наличие и тональность сообщений от топовых блогеров, крупных сообществ и лидеров мнений, соотношение позитивных и негативных сообщений в социальной сети, доли сообщений на интересующую нас тематику в сравнении со средним показателем, присутствия ботов [3]. Данный рейтинг формируется на основе исследований только в социальных сетях, и для повышения достоверности оценки общественного мнения необходимо включить в рассмотрение информацию, которая накапливается на тематических форумах и сайтах, различные социологические опросы, высказывания лидеров мнений и инфлюенсеров и т.д. [3]. Современные исследования показывают, какое негативное воздействие могут оказать лидеры мнений и инфлюенсеры на продвижение тех или иных продуктов или идей [12, 13].

На основе рассмотренного выше подхода для определения установок потребителя участников информационно-семантического поля мегапроекта в рамках проведенного исследования предлагается использовать такие характеристики, как активность интернет-пользователей, долю сообщений на исследуемую тематику, тональность публикаций в электронных СМИ и социальных сетях, а также наличие сообщений от инфлюенсеров и лидеров мнений (топовых блогеров, крупных сообществ и т.д.) за рассматриваемый период времени [3]. Сами характеристики, отражающие установки потребителей, представлены на рис. 1.

Первые две характеристики показывают популярность мероприятия программы лояльности, остальные – отражают общественное мнение о ней [14, 15]. Все вместе эти характеристики показывают уровень общественной приемлемости мегапроекта за установленный временной интервал.

missing image file

Рис. 1. Характеристики, отражающие установки потребителя

Исследование установок потребителя для стран Белоруссии, Венгрии, Турции и Финляндии за 2019–2021 гг., где строительство российских АЭС находится в разных фазах жизненного цикла, проводилось в несколько этапов.

Предварительный этап. На основе методики, предложенной ранее [5], были определены индексы информационного риска для четырех стран за 2017–2018 гг.

Этап 1. На этом этапе с помощью приложения Google Trends была определена активность интернет-пользователей по отношению к теме «атомная энергетика» для региона строительства российской АЭС, соседних и столичного регионов для каждой из четырех стран. Предварительные результаты представлены в работе [3].

Этап 2. На втором этапе были собраны и предобработаны новостные сообщения электронных СМИ для каждой из четырех стран, и с помощью сверточных нейронных сетей CNN определена их тональность. Предварительные результаты по Венгрии и Финляндии отражены в [9].

Этап 3. На третьем этапе с помощью метода двойной ансамблевой кластеризации с изменяющейся метрикой расстояния были выделены лидеры мнений и экспертным путем определена тональность их высказываний. На основе полученных данных были рассчитаны индексы информационных рисков для Белоруссии, Венгрии, Турции и Финляндии.

Этап 4. На четвертом этапе для Белоруссии был проанализирован русскоязычный сегмент YouTube за 2019–2021 гг., выделены наиболее популярные каналы, ролики которых были посвящены АЭС. Определена тональность таких роликов и выделены инфлюенсеры. Индекс информационного риска для Белоруссии рассчитан с учетом информации социальных сетей.

Предлагаемая методика. Для индекса информационного риска были выделены две составляющие, определяемые на основе анализа информационно-семантического поля:

− изучение и анализ публикаций СМИ относительно мегапроекта с учетом тональности;

− изучение и анализ социальных сетей относительно мегапроекта с учетом тональности.

Кроме того, на основе интернет-активности определяется корректирующий коэффициент Kакт.

Таким образом, индекс информационного риска Rинф вычисляется по формуле

Rинф = (Rсми*Wсми + Rсоц*Wсоц)*Kакт, (1)

где Rсми – индекс информационного риска по СМИ, Rсоц – индекс информационного риска по социальным сетям, Wсми и Wсоц – соответствующие весовые коэффициенты, нормированные к 1.

Рассмотрим подробнее каждый из параметров.

Составляющая СМИ. Для оценки риска на основе анализа информационного пространства по публикациям СМИ определяется тональность текста. При этом в общем объеме публикаций СМИ по теме необходимо выделить долю сообщений от лидеров мнений.

Публикации электронных СМИ разбиваются на три класса [5]:

− класс сообщений с положительной тональностью, доля которого составляет (N+) по отношению к общему количеству на заданную тематику;

− класс сообщений с негативной тональностью, доля которого определяется как (N-);

− класс сообщений с нейтральной тональностью с долей (Nn).

Веса этих классов для оценки параметров риска определяются экспертным путем и составляют (R+) = 0, (R–) = 0,9 и (Rn) = 0,3 соответственно [5].

В результате тонального анализа N сообщений в отношении конкретного проекта строительства атомного объекта в определенном регионе индекс информационного риска по СМИ вычисляется согласно формуле

R0сми = (N+)*(R+) + (N–)*(R–) + Nn*Rn.(2)

Затем по такой же методике определяется значение индекса информационного риска по сообщениям СМИ лидеров мнений по формуле

RLсми = (NL+)*(R+) +

+ (NL–)*(R–) + NLn*Rn. (3)

где RLсми – индекс информационного риска сообщениям СМИ лидеров мнений, Ri – значение рискового параметра для i-го класса (+,–,n), NLi – доля количества сообщений СМИ лидеров мнений класса для i-го (+,–,n).

Кроме того, определяется доля сообщений лидеров мнений в общем количестве сообщений – dL. Затем вычисляется значение индекса информационного риска по СМИ, с учетом предположения, что значимость сообщений лидеров мнений весомее, чем остальные публикации:

Rсми = RLсми * 1,2*dL +

+ R0сми*(1 – 1,2*dL). (4)

Составляющая соцмедиа. Составляющая информационного риска мегапроекта на основе анализа социальных сетей (Rсоц) оценивается через интегральный рейтинг ISMI (Integrum Social Media Influence).

В рамках данного исследования предлагается следующая формула

Rсоц = 1 – ISMI/10. (5)

Весовые коэффициенты Wсми и Wсоц. Эти весовые коэффициенты нормированы к 1 и связаны формулой

Wсми + Wсоц = 1. (6)

Так как, согласно экспертным оценкам, упоминание в СМИ задействует большие массы населения, а также является инструментом привлечения внимания государственных и корпоративных структур, поэтому имеет более значимый весовой вклад. Предлагается использовать следующие значения:

Wсми = 0,6; Wсоц = 0,4. (7)

Корректирующий коэффициент интернет-активности Kакт. Корректирующий коэффициент предлагается сделать зависимым от интернет-активности пользователей в стране, столице и регионе строительства мегаобъекта, а также соседние регионы. Причем для каждой группы определяется свой коэффициент, коэффициенты затем складываются в общую формулу:

Какт = Wстр*Кстр + Wстл*Кстл +

+ Wрег*Крег + Wссд*Кссд, (8)

где Кстр, Кстл, Крег и Кссд определяют составляющую для страны в целом, столичный регион, регион строительства АЭС и соседние регионы соответственно.

Исходя из экспертных оценок, весовые коэффициенты выбираются следующим образом:

Wрег = 0,4, Wстр = 0,3,

Wссд = 0,2, Wстл = 0,1. (9)

Региональная активность имеет наибольший вклад, поскольку влияние в конкретном месте строительства на общественные массы имеет наибольшее значение. Страновая составляющая имеет несколько меньшее значение, определяющее общую тенденцию в обществе. Столичная составляющая вносит наименьший вклад, поскольку новостная повестка столицы зачастую несильно пересекается с промышленными и отраслевыми событиями страны.

Значение коэффициентов оценивается на основе интереса пользователей в стране, столице и регионе сооружения соответственно, предлагается шкала:

− К = 0,6, если интерес совсем низкий или отсутствует;

− К = 0,8, если интерес преимущественно низкий, но периодически умеренный;

− К = 1,0, если интерес преимущественно умеренный, но периодически высокий;

− К = 1,2, если интерес преимущественно умеренный и высокий.

После этого определяется значение корректирующего коэффициента интернет-активности.

После определения составляющих информационного риска по СМИ и соцмедиа, их весовых коэффициентов и корректирующего коэффициента интернет-активности рассчитывается индекс информационного риска мегапроекта:

Rинф = (Rсми*Wсми + Rсоц*Wсоц)*Какт. (10)

Как правило, индекс информационного риска учитывается совместно с другими индексами риска (политическими, экономическими, страновыми и т.д.) в методике оценки риска проекта сооружения АЭС [5].

Результаты исследования и их обсуждение

На предварительном этапе исследования была проведена оценка индекса информационного риска за 2017–2018 гг. реализации мегапроектов в четырех странах (Белоруссия, Венгрия, Финляндия, Турция) по методу, ранее предложенному авторами данного проекта [5] без учета социальных медиа, инфлюенсеров и лидеров мнений, интернет-активности пользователей. Рассчитанные индексы информационного риска для Белоруссии, Венгрии, Турции и Финляндии за 2017–2018 гг. составили 0,2110; 0,4234; 0,4467 и 0,4816 соответственно.

На первом этапе на основании данных по активности интернет-пользователей по отношению к теме «атомная энергетика» для региона строительства российской АЭС, соседних и столичного регионов, а также для стран в целом для Белоруссии, Венгрии, Турции и Финляндии за 2019–2021 гг. корректирующего коэффициента Какт. Расчет проводился на основе формулы (8), полученные значения представлены в табл. 1. При расчетах были использованы следующие весовые коэффициенты, учитывающие значимость страны в целом, региона строительства, соседних и столичных регионов соответственно предположению (9): Wрег = 0,4, Wстр = 0,3, Wссд = 0,2, Wстл = 0,1.

Как видно из таблицы, во всех странах наибольшая активность интернет-пользователей наблюдается в регионах строительства АЭС. Соседние регионы, как правило, очень мало интересуются темой атомной энергетики.

На втором этапе на основе исследований, проведенных по изучению публикаций СМИ в рассматриваемых странах за 2019–2021 гг., были определены значения тональности публикаций (табл. 2) и проведен расчет для составляющей СМИ без учета лидеров мнений R0сми. При этом класс положительных высказываний учитывался со значением рискового параметра 0, нейтральных высказываний – 0,3, а негативных высказываний – 0,9.

Из таблицы 2 видно, что наибольшая доля публикаций с негативной тональностью присутствует в Венгрии и Финляндии, что дает значительный прирост составляющей СМИ R0сми. В качестве инструмента определения тональности высказываний использовались сверточные нейронные сети. Для построения нейросети использовался размеченный набор данных новостных лент по теме ядерной энергетики объемом 8000 записей. Реализованная нейронная сеть состояла из четырех скрытых слоев, а процесс обучения включал десять эпох. Разработанный метод стал основой для создания программно-технического решения (рис. 2), автоматизирующего процесс сбора данных и предобработки из социальных сетей и новостных площадок с целью анализа тональности текстовых сообщений.

Таблица 1

Корректирующий коэффициент, учитывающий региональную активность интернет-пользователей (2019–2021 гг.)

Страна

Кстр

Кстл

Крег

Кссд

Какт

Белоруссия

0,60

0,60

0,80

0,60

0,68

Венгрия

0,80

0,80

1,00

0,60

0,84

Турция

0,80

0,80

0,80

0,80

0,80

Финляндия

0,60

0,60

1,00

0,60

0,68

Таблица 2

Индекс информационного риска для СМИ без учета лидеров мнений (2019–2021 гг.)

Страна

N+

N-

Nn

R0сми

Белоруссия

0,2587

0,1523

0,5890

0,3138

Венгрия

0,2362

0,5456

0,2182

0,5565

Турция

0,2119

0,0409

0,7472

0,2610

Финляндия

0,2304

0,4216

0,3480

0,4838

missing image file

missing image file

Рис. 2. Интерфейс программно-технического решения анализа тональности текстовых сообщений

На третьем этапе были проведены расчеты для этих же проектов за 2019–2021 гг. по методике, предложенной в рамках данного исследования, с учетом интернет-активности пользователей и лидеров мнений на основе формулы (1). При этом отметим, что составляющая информационного риска, определяемая по социальным сетям, не была оценена. Поэтому в данном случае Wсми = 1, а Wсоц = 0 и формула для расчетов будет выглядеть следующим образом:

Rинф = Rсми*Kакт. (11)

Индекс информационного риска по СМИ рассчитывается с помощью формулы (4). На основе исследований, проведенных по изучению публикаций СМИ в рассматриваемых странах за 2019–2021 гг., были определены следующие значения тональности публикаций (табл. 3) и проведен расчет для составляющей СМИ с учетом лидеров мнений Rсми. Сами лидеры мнений были выделены с помощью метода двойной кластеризации с изменяющейся метрикой расстояния. При этом класс положительных высказываний учитывался со значением рискового параметра 0, нейтральных высказываний – 0,3, а отрицательных высказываний – 0,9.

Из таблицы видно, что учет тональности высказываний лидеров мнений для Венгрии, Турции и Финляндии внес значительные коррективы в составляющую СМИ Rсми: для Венгрии и Финляндии она уменьшилась на 15 и 32 % соответственно, а для Турции увеличилась на 29 %.

Полученные индексы информационных рисков, учитывающие региональную активность интернет-пользователей и тональность высказываний лидеров мнений, отражены в табл. 4.

Таблица 3

Индекс информационного риска для СМИ с учетом лидеров мнений dL (2019–2021 гг.)

Страна

NL+

NL-

NLn

RLсми

dL

Rсми

Белоруссия

0,1053

0,1053

0,7894

0,3316

0,1617

0,3172

Венгрия

0,6519

0,1630

0,1851

0,2022

0,2018

0,4707

Турция

0,3750

0,3150

0,3100

0,3765

0,7435

0,3640

Финляндия

0,4080

0,1600

0,4320

0,2736

0,6127

0,3293

Таблица 4

Индексы информационных рисков для Белоруссии, Венгрии, Турции и Финляндии за 2017–2018 гг. и 2019–2022 гг.

Страна

Rсми

Какт

Rинф 2019–2021

Rинф 2017–2018

Белоруссия

0,3172

0,68

0,2157

0,2110

Венгрия

0,4707

0,84

0,3954

0,4234

Турция

0,3640

0,80

0,2912

0,4467

Финляндия

0,3293

0,68

0,2239

0,4816

Таким образом, из таблицы видно, что информационный риск проектов в Белоруссии и Венгрии примерно сохраняется. А в Турции и Финляндии со временем существенно снизился, чему способствовали программы лояльности и политика продвижения технологий, проводимая Госкорпорацией «Росатом».

На четвертом этапе был проведен учет составляющей социальных сетей в индексе информационного риска. Поскольку исследование проводилось в середине 2022 г., это стало возможно только для Белоруссии. Из русскоязычного сегмента YouTube были отобраны каналы, где в заголовках видео упоминается тематика АЭС. Максимальное количество извлеченных видео для каждого канала составило 180.

Были рассмотрены и проанализированы каналы, на которых количество видео с упоминаниями про АЭС больше или равно 5. Для таких каналов была проведена оценка тональности заголовков всех опубликованных видео. Всего таких каналов было 49, но в одном из них заголовки не имели содержательной части.

Уровень тональности определялся как сумма значений по каждому видео, где «1» – положительная, «0» – нейтральная, «-1» – отрицательная. Процент положительных роликов определяется как отношение «Уровень тональности» к общему числу видео с упоминанием АЭС. Из этой массы были выбраны наиболее популярные каналы (число подписчиков свыше 100000), результаты представлены в табл. 5.

На основе полученных данных были определены коэффициенты охвата по тематике АЭС с учетом тональности сообщений в зависимости от общего количества подписчиков, общего количества публикаций видео и количества по тематике АЭС. При расчетах был использован такой же подход при определении рискового параметра для положительных, нейтральных и негативных публикаций, как и для оценки сообщений СМИ: класс положительных высказываний учитывался со значением рискового параметра 0, нейтральных высказываний – 0,3, а отрицательных высказываний – 0,9. Далее было определено значение нормированного индекса информационного риска для каждого канала Ri, которые представлены в табл. 6.

В результате получаем значение индекса информационного риска для белорусских социальных сетей Rсоц = 0,466. С учетом весовых коэффициентов Wсми = 0,6, Wсоц = 0,4 и корректировочного коэффициента для Какт = 0,68, используя формулу 3, получаем значение индекса информационного риска для Белоруссии Rинф = 0,2562. Это значение на 16 % больше, чем значение, полученное без учета социальных сетей.

Таким образом, интернет-пользователи и пользователи социальных сетей вносят ощутимый вклад в формирование общественного мнения в странах строительства российских атомных электростанций, понижая или повышая уровень приемлемости атомной энергетики. При формировании программы лояльности для подобных мегапроектов необходимо учитывать соответствующие каналы воздействия на интернет-аудиторию.

Таблица 5

Результаты анализа наиболее популярных каналов YouTube в Белоруссии (2019–2021 гг.)

Канал

Количество подписчиков

 

Кол-во видео про АЭС

Уровень тональности

Процент положительных роликов

KREOSAN

4 910 000

150

13

0

0 %

Влад Резнов

1 660 000

180

18

-16

-89 %

Aleksandr Semchenko

865 000

180

6

3

50 %

Майкл Наки

646 000

180

6

-6

-100 %

Страна.ua

593 000

180

5

-2

-40 %

Алексей Гончаренко

592 000

180

5

1

20 %

ЗНАЮ ВСЁ

448 000

180

39

-17

-44 %

И Грянул Грэм

274 000

180

10

1

10 %

Супер.Уралов.

252 000

180

5

3

60 %

Roman Romanov

202 000

150

6

-2

-33 %

ГИПЕРБОРЕЙ

173 000

180

8

6

75 %

Геоэнергетика ИНФО

122 000

180

18

1

6 %

Маланка Медиа

119 000

180

10

-4

-40 %

Росатом

117 000

79

39

12

31 %

Таблица 6

Значения нормированных индексов информационного риска для YouTube каналов в Белоруссии (2019–2021 гг.)

Канал

Коэффициент охвата аудитории

Значение нормированного Ri

KREOSAN

3,878

0,183

Влад Резнов

-1,346

0,191

Aleksandr Semchenko

0,131

0,000

Майкл Наки

-0,196

0,028

Страна.ua

-0,060

0,003

Алексей Гончаренко

0,030

0,001

ЗНАЮ ВСЁ

-0,386

0,055

И Грянул Грэм

0,014

0,001

Супер.Уралов.

0,038

0,000

Roman Romanov

-0,025

0,001

ГИПЕРБОРЕЙ

0,053

0,000

Геоэнергетика ИНФО

0,006

0,000

Маланка Медиа

-0,024

0,003

Росатом

0,162

0,000

Заключение

Таким образом, развитие авторского метода определения индекса информационного риска, проведенного в рамках данного исследования, показало, что учет активности интернет-пользователей, высказываний лидеров мнений и тональности постов в социальных сетях значительно повышает точность оценки. Так, оценка индекса информационного риска, проведенного для Белоруссии, Венгрии, Турции и Финляндии за 2017–2018 гг. и 2019–2021 гг., показала, что информационный риск проектов в Белоруссии и Венгрии примерно сохраняется. А в Турции и Финляндии со временем существенно снизился, чему способствовали программы лояльности и политика продвижения технологий, проводимая Госкорпорацией «Росатом».

Работа поддержана грантом РФФИ № 20-010-00708\22.