АВТОМАТИЗАЦИЯ ПРОЦЕССА ОБРАБОТКИ КЛИЕНТСКИХ ОБРАЩЕНИЙ

Чернявская А.В. 1, Горшков К.А. 1

1 Федеральное государственное образовательное бюджетное учреждение высшего образования «Финансовый университет при Правительстве Российской Федерации»

Чернявская А.В. - работа с данными, проведение исследования, разработка программного обеспечения, валидация результатов, написание черновика рукописи

Горшков К.А. - разработка концепции, анализ данных, проведение исследования, методология исследования, научное руководство, валидация результатов, написание рукописи – рецензирование и редактирование

В работе рассматривается процесс автоматизации взаимодействия с клиентами. Целью работы является моделирование процессов для автоматизированной системы обработки клиентских обращений и подбор наиболее эффективных моделей машинного обучения для определения тональности обратной связи. В рамках исследования выполнено моделирование автоматизации процесса обработки клиентских обращений с использованием системных инструментов BPMN и UML-диаграмм последовательности, что позволило структурировать и сделать более понятными ключевые этапы построения обратной связи с клиентами. В предложенных схемах отдельно рассмотрен ML-анализатор, предназначенный для определения тональности сообщений и автоматической генерации задач для сотрудников. В работе проведено экспериментальное сравнение характеристик трех алгоритмов для задачи определения тональности (sentiment analysis): BERT, DistilBERT и TextBlob. Оценка их эффективности осуществлялась с использованием метрики F1-score на трех различных наборах данных: Yelp Review Polarity Dataset, Amazon Product Reviews Dataset и Rotten Tomatoes Reviews Dataset. Наилучшие результаты по метрике F1-score демонстрирует модель BERT, хотя по времени на обучение и обработку данных она немного уступает другим моделям и фреймворкам, с которыми проводилось сравнение в данной работе.

Статья в формате PDF

2192 KB

автоматизация взаимодействия

BPMN-диаграммы

диаграммы последовательности UML

анализ тональности

BERT

ML-анализатор

1. Гиздуллина Э. А., Казанцева К. А. Лояльность через качество: роль обслуживания клиентов в электронной коммерции // Цифровая экономика глазами студентов: материалы V Международной научной конференции (Казань, 16 мая 2025 г.). Казань: ИП Сагиев А. Р., 2025. С. 53–57. EDN: SPIENX.

2. Стремоусова Е. Н. Эффективность обратной связи и ее специфика в организации // Прикладная юридическая психология. 2008. № 2. С. 75–86. URL: https://elibrary.ru/download/elibrary_15270227_28611886.pdf (дата обращения: 23.03.2026).

3. Арбатская Е. А. Стратегия как инструмент управления конкурентоспособностью предприятия // Бизнес. Образование. Право. 2018. № 4 (45). С. 93–96. URL: https://elibrary.ru/download/elibrary_36368581_20797860.pdf (дата обращения: 23.03.2026). DOI: 10.25683/VOLBI.2018.45.402.

4. Голикова А. С. Негативные отзывы розничных клиентов банков в сети Интернет // Банковская система: устойчивость и перспективы развития: сборник научных статей шестнадцатой международной научно-практической конференции по вопросам финансовой и банковской экономики (Пинск, 24 октября 2025 г.). Пинск: Учреждение образования «Полесский государственный университет», 2025. С. 25–28. URL: https://rep.polessu.by/handle/123456789/35030 (дата обращения: 23.03.2026).

5. Natorina A. O. Simulation Model of the Retailer’s Response to Negative Online Buyer’s Reviews and Comments // Бизнес информ. 2020. № 2 (505). P. 451–457. URL: https://www.elibrary.ru/download/elibrary_42896917_76491677.pdf (дата обращения: 23.03.2026). DOI: 10.32983/2222-4459-2020-2-451-457.

6. Емельянов А. М. Автоматизация обратной связи в обучении с помощью нейросетей: возможности и ограничения // Воспитательная работа в школе. 2025. № 1. С. 15–30. URL: https://narodnoe.org/journals/vospitatelnaya-rabota-v-shkole/2025-1/avtomatizaciya-obratnoiy-svyazi-v-obuchenii-s-pomoshyu-neiyroseteiy-vozmojnosti-i-ogranicheniya (дата обращения: 23.03.2026).

7. Иванченко О. В. Развитие чат-ботов на основе технологии NLP в маркетинговой деятельности компаний // Инфраструктура рынка: проблемы и перспективы: ученые записки. Вып. 28. Ростов-на-Дону: Ростовский государственный экономический университет «РИНХ», 2023. С. 69–73. URL: https://www.elibrary.ru/download/elibrary_54735601_90971658.pdf (дата обращения: 23.03.2026).

8. Абрамян Н. С. Автоматизация системы обратной связи при помощи Telegram-бота Центра управления регионом // Государство и граждане в электронной среде. 2024. № 7. С. 59–68. URL: https://ojs.itmo.ru/index.php/SCEE/article/view/1348/1159 (дата обращения: 23.03.2026). DOI: 10.17586/2541-979X-2024-7-59-68.

9. Есин Т. Е., Глухих И. Н. Автоматизация предоставления персонализированной обратной связи на курсах изучения программирования // Моделирование, оптимизация и информационные технологии. 2019. Т. 7. № 1 (24). С. 482–493. URL: https://www.elibrary.ru/download/elibrary_37419033_17985360.pdf (дата обращения: 23.03.2026). DOI: 10.26102/2310-6018/2019.24.1.043.

10. Хусаинов Ш. Г., Горшков К. А. Подведение итогов деятельности обучаемого в автоматизированном лабораторном практикуме // Наукосфера. 2023. № 8–2. С. 25–29. EDN: LMHKWL.

11. Хусаинов Ш. Г., Горшков К. А. Варианты систем автоматизированного обучения и их дидактический потенциал // Современные наукоемкие технологии. 2024. № 5–1. С. 221–225. URL: https://www.elibrary.ru/download/elibrary_67351449_63886239.pdf (дата обращения: 23.03.2026). DOI: 10.17513/snt.40032.

12. Волковский К. М. Анализ существующих технологий искусственного интеллекта для использования в оптимизации бизнес-процессов // Наука и технологии – 2025: сборник статей II Международной научно-практической конференции. Петрозаводск: Международный центр научного партнерства «Новая Наука» (ИП Ивановская И. И.), 2025. С. 114–119. URL: https://elibrary.ru/download/elibrary_82133188_71076791.pdf (дата обращения: 23.03.2026).

13. Сбоев А. Г., Воронина И. Е., Гудовских Д. В., Селиванов А. А. Продвинутые нейросетевые модели для решения задачи определения тональности // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2016. № 4. С. 178–183. URL: https://www.elibrary.ru/download/elibrary_28320141_39085976.pdf (дата обращения: 23.03.2026).

14. Мартынова И. Р., Платонов Е. Н. Семантический анализ отзывов об организациях методами машинного обучения // Моделирование и анализ данных. 2024. Т. 14. № 1. С. 7–26. URL: https://www.elibrary.ru/download/elibrary_65582559_17533547.pdf (дата обращения: 23.03.2026).

15. In S., Chanchamnan S. Comparison of VADER and TextBlob labeling for sentiment analysis using machine learning and deep learning models: A study on generative AI user experience // Acta Psychologica. 2026. Vol. 263. (106268). P. 1–17. URL: https://www.sciencedirect.com/science/article/pii/S0001691826000673 (дата обращения: 23.03.2026).

Введение

Качество обслуживания клиентов для современного бизнеса, независимо от того, какая категория товаров или услуг предлагается, выступает одним из наиболее значимых факторов, определяющих успех и позиции на конкурентном рынке [1, 2]. Ведущим инструментом, позволяющим грамотно выстраивать взаимоотношения с клиентами, зачастую является система обратной связи. С одной стороны, она позволяет своевременно реагировать на рекламации и решать задачи тактического назначения, не давая конфликтным ситуациям усугубляться. А с другой, формировать стратегические управленческие решения на основе собранной статистики [3]. Если положительные отзывы в основном влияют на формирование репутационного поля, то отзывы негативного плана, помимо этого, могут приводить к реальным потерям и оттоку важных клиентов [4, 5]. К сожалению, существующие у большинства компаний традиционные методы обработки обращений часто связаны с ручной работой, высокой нагрузкой на сотрудников и риском ошибок, что приводит к затягиванию решения проблем. Помимо этого, без специализированных инструментов часто не удается сразу определить приоритетность и категорию каждого обращения. Нередко система обратной связи имеет недостаточную интеграцию с внутренними процессами компании, что может приводить к ненамеренному игнорированию негативных отзывов [6]. Многие организации не имеют инструментов для комплексного анализа обратной связи, а без него невозможно выявить системные проблемы и своевременно принимать управленческие решения. В связи с этим возникает необходимость разработки и внедрения автоматизированных систем, способных анализировать отзывы с использованием современных методов анализа текста (например, машинного обучения), классифицировать обращения и автоматизировать маршрутизацию процессов решения проблем. На актуальность такой разработки также указывает использование инструментов автоматизации обратной связи как крупными частными корпорациями (например, чат-боты и виртуальные ассистенты Tele2 и Sberbank) [7], так и учреждениями государственного сектора [8]. Нередко подобного рода системы встречаются в автоматизированных системах обучения [9–11].

Цель исследования – моделирование процессов для автоматизированной системы обработки клиентских обращений и подбор наиболее эффективных моделей машинного обучения для определения тональности обратной связи.

Материалы и методы исследования

В рамках данного исследования проведено экспериментальное сравнение характеристик трех алгоритмов для задачи определения тональности (sentiment analysis): BERT, DistilBERT и TextBlob. Оценка их эффективности осуществлялась с использованием метрики F1-score на трех различных наборах данных. В качестве исходных материалов использовался Yelp Review Polarity Dataset1 – сбалансированный набор данных, содержащий 598 000 текстовых отзывов, которые оставляли пользователи о различных предприятиях сферы услуг: отрицательные (1 и 2 звезды) и положительные (3 и 4 звезды). Вторым источником данных выступал Amazon Product Reviews Dataset2 – набор отзывов на товары с платформы Amazon, включающий 142 млн объектов и характеризующийся большим разнообразием тем и форматов отзывов. Третьим датасетом был выбран Rotten Tomatoes Reviews Dataset (Movie Review Sentence Polarity Dataset)3, который содержит короткие текстовые фрагменты из кинорецензий, численностью 10 662 примеров, и из-за небольшой средней длины предложений (около 21 слова) удобен для оценки эффективности моделей в условиях дефицита контекста. Моделирование бизнес-процессов автоматизированной обработки отзывов проводилось с помощью BPMN-диаграмм и диаграмм последовательности (Sequence Diagram) в нотации UML, что позволило более структурированно описать все этапы обработки и взаимодействие системных компонентов.

Результаты исследования и их обсуждение

Процесс обработки клиентского отзыва в информационной системе компании реализуется поэтапно, что важно учитывать на всем жизненном цикле разработки. Принимая во внимание обзор существующих решений для автоматизации управления клиентскими запросами в различных областях [9, 12] и видоизменив стандартные схемы реализации таких решений, можно предложить следующий сценарий работы. После того как отзыв поступает в систему, производится его автоматизированный анализ, который осуществляется за счет встроенного модуля машинного обучения. Сам ML-анализатор выполняет задачу по определению тональности отзыва (позитивная, нейтральная, негативная). В зависимости от алгоритма машинного обучения такой модуль может также соотнести отзыв с конкретной категорией и присвоить обращению степень срочности или приоритетности реагирования, указывая это затем в диспетчере задач. В системе также необходимо предусмотреть отдельный модуль для сбора и хранения поступивших обращений, реализованный в виде единой базы данных. Лицам, принимающим решения, доступ к таким данным позволяет отслеживать истории взаимодействия с конкретным клиентом для персонализации предложений, а также проводить комплексный анализ динамики настроений и предпочтений всех клиентов.

Рис. 1. BPMN диаграмма возможных процессов в автоматизированной системе для обработки отзывов Примечание: составлен авторами по результатам данного исследования

Рис. 2. Модель последовательностей действий компонентов автоматизированной системы обработки отзывов Примечание: составлен авторами по результатам данного исследования

Таблица 1

Сравнение моделей и фреймворков для определения тональности

Модель / Фреймворк	Тип модели	Преимущества	Недостатки	Области использования
BERT	Трансформер	Высокая точность, хорошо понимает контекст	Требует больших вычислительных ресурсов	Исследовательские проекты
RoBERTa	Модификация BERT	Оптимизированная версия BERT с улучшенной точностью	Сложность настройки и обучения	Коммерческие сервисы NLP
DistilBERT	Упрощенный BERT	Быстрее и легче при сохранении качества	Немного уступает в точности большим моделям	Бизнес-приложения с ограниченными ресурсами
TextBlob	Библиотека Python	Простота использования, наличие базовых возможностей	Ограниченная точность на сложных отзывах	Малые и средние проекты, обучение новичков
VADER	Лексический анализ	Подходит для соцсетей и коротких сообщений	Не справляется с иронией и сложным контекстом	Анализ социальных медиа и маркетинг
FastText	Встраивание слов	Быстрая работа, поддержка многих языков	Меньше внимания к контексту	Проекты с многими языками
RuBERT	Русскоязычный BERT	Высокая точность для русского языка	Требует настройки под конкретные задачи	Анализ отзывов в России, локализованные решения

Примечание: составлена авторами на основе источников [13–15].

В автоматизированной системе по итогам работы ML-модуля должны формироваться задачи для сотрудников (например, обработка жалоб, подготовка ответов, проведение разъяснительной работы или инициирование улучшений). Использование правильного диспетчера задач позволяет также осуществлять мониторинг исполнения автоматически выставленных поручений, а в случае затруднения в принятии решения давать возможность связаться с клиентом, если это CRM-система (Customer Relationship Management), или получить разъяснения у руководителя. Примерный вариант описания бизнес-процессов для такой системы представлен на рис. 1.

Учет всех участников взаимодействия при проектировании автоматизированной системы обработки отзывов, а также последовательность их действий могут быть отражены с помощью диаграммы последовательностей в нотации UML (рис. 2). Это дает разработчику более полное представление о хронологии действий и ключевых модулях системы. На диаграмме в отдельные Lifelines выделены клиент, ИТ-система, ML-анализатор, база данных, ответственный исполнитель и руководитель.

Отдельного внимания заслуживает процесс отбора алгоритма машинного обучения для ML-анализатора. Как показывает ряд авторов [13–15], в задачах определения тональности, в том числе для отзывов, оставленных на различных платформах клиентами, высокую эффективность демонстрируют DistilBERT, TextBlob, VADER, FastText, RuBERT. Для дальнейшего отбора с целью рекомендации к использованию в автоматизированной системе обработки отзывов было проведено сопоставление этих моделей и фреймворков по ряду параметров. Результаты приводятся в табл. 1.

Исходя из проведенного сравнительного анализа различных моделей и фреймворков, для дальнейшей экспериментальной проверки на данных целесообразнее выбрать BERT, DistilBERT, TextBlob и RuBERT. Однако область применения последней модели ограничивается русскоязычными текстами, и, несмотря на то, что проверка этой модели была бы полезна для отечественных систем, предназначенных для взаимодействия с клиентами, отсутствие реальных (не синтетических) данных в открытом доступе затрудняет ее объективное сравнение с другими моделями. Возможно, сбор данных об отзывах в русскоязычном сегменте с их последующей разметкой мог бы стать отдельной исследовательской задачей и оказать ценную помощь для разработки более точных и релевантных моделей по анализу клиентских настроений.

Как было описано в разделе «Материалы и методы исследования», сравнение моделей производилось на трех различных датасетах (Yelp Review Polarity Dataset, Amazon Product Reviews Dataset и Rotten Tomatoes Reviews Dataset), хорошо зарекомендовавших себя в задачах определения тональности. Значение основных метрик, а также время работы моделей при экспериментальном сравнении приведены в табл. 2.

Результаты работы моделей сопоставлялись по значениям стандартных метрик задачи классификации: Accuracy, Precision, Recall, F1-score (учитывающей баланс точности и полноты предсказаний), а также по времени, затраченному на предсказание и обучение модели. Последний столбец табл. 2 показывает, что TextBlob, основанный на простых правилах и словарях, обладает преимуществом довольно быстрого развертывания и низкой вычислительной сложности, что может быть полезно для ряда прикладных сценариев, где время играет решающую роль. Однако по всем трем метрикам TextBlob демонстрирует самые низкие оценки.

В задачах анализа настроений или определения характера отзыва важна способность модели находить все позитивные примеры без чрезмерных ложных срабатываний, что делает F1-score более информативной, чем остальные метрики по отдельности. Также эта метрика особенно полезна для данных с несбалансированными классами, поскольку обеспечивает более объективную оценку при определении миноритарного класса. Сравнение BERT, DistilBERT и TextBlob по значениям F1-score приведено на рис. 3.

Таблица 2

Оценка качества определения тональности BERT, DistilBERT, TextBlob и время их работы

Модель/ фреймворк	Датасет	Accuracy	Precision	Recall	F1-Score	Время на итерацию/ предсказание
DistilBERT	Yelp Review Polarity	86,0 %	87,0 %	85,0 %	86,0 %	0,5 мин / 1,2 мин
	Amazon Product Reviews	87,8 %	86,2 %	88,4 %	87,3 %	0,6 мин / 1,3 мин
	Rotten Tomatoes Reviews	82,5 %	83,5 %	80,5 %	82,0 %	0,5 мин / 1,2 мин
TextBlob	Yelp Review Polarity	65,0 %	60,0 %	55,0 %	57,0 %	4 с / 13 с
	Amazon Product Reviews	73,2 %	72,5 %	73,8 %	73,1 %	5 с / 15 с
	Rotten Tomatoes Reviews	51,0 %	60,0 %	48,5 %	52,5 %	4 с / 12 с
BERT	Yelp Review Polarity	88,0 %	89,0 %	87,0 %	88,0 %	1 мин / 2,5 мин
	Amazon Product Reviews	89,2 %	88,7 %	89,8 %	89,2 %	1,5 мин / 2,8 мин
	Rotten Tomatoes Reviews	87,0 %	88,0 %	85,0 %	86,0 %	1 мин / 2,4 мин

Примечание: составлена авторами на основе полученных данных в ходе исследования.

Рис. 3. Сравнение моделей по метрике F1-score на различных датасетах Примечание: составлен авторами по результатам данного исследования

На всех трех наборах данных, несмотря на самые большие временные затраты на обучение и работу, модель BERT оказалась наиболее успешной. Она проявила себя эффективнее облегченной модели DistilBERT и значительно превзошла по ключевой метрике F1-score результаты TextBlob. В автоматизированных системах обработки клиентских обращений, бесспорно, ее можно рекомендовать в качестве ведущей модели ML-анализатора не только из общих соображений и обзора опубликованных сведений, но и по итогам экспериментальной проверки.

Для автоматизированных систем с большим объемом отзывов и активной обратной связью от клиентов модуль машинного обучения может включать суммаризатор отзывов. Суть его работы состоит в том, что он создает короткие и сжатые варианты по большому числу отзывов с сохранением смысла. Это позволяет не только аналитическому отделу отслеживать какие-то глобальные тенденции, но и самим пользователям быстрее ориентироваться при выборе товара или сервиса, которые предоставляет компания. Однако разработка такого суммаризатора требует отдельного исследования и экспериментального сравнения различных моделей машинного обучения по преобразованию длинных текстов в короткие и не входит в задачи данной работы.

Заключение

В рамках данной работы было проведено моделирование автоматизации процесса обработки клиентских обращений с использованием системных инструментов BPMN и UML-диаграмм последовательности. Это позволило выделить и сделать более понятными основные этапы обработки обратной связи от клиентов.

В рассмотренные схемы предложено включить ML-анализатор, который предназначен для определения тональности клиентских сообщений (sentiment analysis) и автоматической генерации задач для сотрудников с указанием их приоритета. В работе был осуществлен экспериментальный отбор модели для такого анализатора, для этого DistilBERT, TextBlob и RuBERT были протестированы на трех различных наборах данных. Лучшие результаты по метрике F1-score продемонстрировала модель BERT, что подтверждает ее высокую точность и возможность использования для задач анализа пользовательских обращений.

Полученные результаты могут быть полезны разработчикам в области интеграции искусственного интеллекта в автоматизированные системы, что позволит компаниям, использующим такие системы, более эффективно осуществлять как тактические решения, требующие незамедлительных мер, так и стратегическое планирование на основе исторических данных.

[1] Yelp Review Polarity Dataset [Электронный ресурс]. URL: https://www.tensorflow.org/datasets/catalog/yelp_polarity_reviews?hl=ru (дата обращения: 14.03.2026).

[2] Amazon Product Reviews Dataset [Электронный ресурс]. URL: https://registry.opendata.aws/amazon-reviews/ (дата обращения: 14.03.2026).

[3] Rotten Tomatoes Reviews Dataset [Электронный ресурс]. URL: https://huggingface.co/datasets/cornell-movie-review-data/rotten_tomatoes (дата обращения: 14.03.2026).

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов

Финансирование

Авторы заявляют об отсутствии внешнего финансирования.

Библиографическая ссылка

Чернявская А.В., Горшков К.А. АВТОМАТИЗАЦИЯ ПРОЦЕССА ОБРАБОТКИ КЛИЕНТСКИХ ОБРАЩЕНИЙ // Современные наукоемкие технологии. 2026. № 5. С. 108-114;
URL: https://top-technologies.ru/ru/article/view?id=40782 (дата обращения: 23.07.2026).
DOI: https://doi.org/10.17513/snt.40782

Научный журнал
Современные наукоемкие технологии

ISSN 1812-7320

"Перечень" ВАК

ИФ РИНЦ = 1,279