Введение
Роль систем управления в технических науках невозможно переоценить. Применение технологий машинного обучения позволяет использовать структуры систем управления на новом уровне. В данной работе показано, как с помощью инструментов Python и библиотеки ScikitLearn можно эффективно выполнять разработку автоматизированной рекомендательной системы. Особенно важной является возможность настройки сервисов системы непосредственно в процессе разработки.
Предметной областью исследования выбраны курортно-оздоровительные технологии. Большой спектр выбора методов санаторно-курортного лечения наводит на мысль о необходимости разработки рекомендательной системы по подбору оздоровительного отдыха. Одним из важнейших компонентов для реабилитации и поддержания здоровья каждого человека является санаторно-курортное лечение, основанное на использовании природных лечебных факторов. Санаторный отдых в условиях пребывания в лечебно-оздоровительной местности эффективно и целенаправленно воздействует на врожденные или приобретенные заболевания, в том числе и на ряд хронических заболеваний. Рост спроса на медицинский туризм в России требует создания автоматизированных систем, способных анализировать параметры санаториев [1].
При выборе санатория необходимо учитывать такие факторы, как медицинский профиль заведения, географическое положение, уровень сервиса и стоимость проживания на одного человека [2]. Существующие платформы бронирования часто ограничиваются фильтрами по базовым параметрам, не предлагая персонализированных рекомендаций [3].
Цель исследования – повышение эффективности работы алгоритмов выбора санатория путем разработки автоматизированной рекомендательной системы по подбору оздоровительного отдыха.
Задачей данной работы ставится разработка интеллектуального алгоритма. Алгоритм на основе анализа медицинских показаний и стоимостных характеристик автоматически подбирает подходящий санаторий и визуализирует результат для сравнительного анализа. Внедрение такой системы позволит пациентам сократить время поиска и повысить качество выбора. Санатории увеличат заполняемость и снизят количество отказов.
Материалы и методы исследования
Актуальность разработки определяется внедрением экспертно-рекомендательной системы. Такая системы сочетает анализ данных, искусственный интеллект и предметные знания [4; 5]. Применение сервисов машинного обучения не только упрощает выбор санатория под индивидуальные запросы пользователя, но и задает новые стандарты в развитии технологий в области курортной медицины [6].
Для реализации системы выбрана среда GoogleColab, язык программирования Python, библиотеки Pandas, Scikit-learn и Matplotlib.
В рамках исследования использован специализированный датасет, отрывок которого представлен на рисунке 1. Датасет содержит 25 наименований санаториев Кавказских Минеральных Вод. В датасет включены следующие параметры санаториев: медицинские профили (номинальные переменные), уровень сервиса (2–5 баллов) и минимальная цена проживания (руб./сутки).

Рис. 1. Фрагмент представления данных, используемых при решении задачи Источник: составлено авторами на основе исследования
Ключевые функциональные элементы включают в себя интерактивный интерфейс для выбора заболеваний, кластеризацию объектов по двум параметрам (цена и рейтинг обслуживания) и автоматизированный подбор аналогов на основе семантического анализа профилей лечения [7].
Система рекомендаций состояла из двух этапов: фильтрации и ранжирования [8; 9]. Пользователь взаимодействует с системой через выпадающий список. Опции формируются автоматически из столбца с профилями заболеваний загруженного датасета.
Кодирование текстовых данных, по которым система выполняет фильтрацию, реализуется посредством перевода текстового списка в вектор-столбец данных Pi, как показано в формуле (1.1). Аналогичным образом обрабатывается список заболеваний.
Для заданного пользователем списка заболеваний D={d1,d2,...,dn} система формирует булеву маску, в которой осуществляется поиск санаториев, где хотя бы один профиль pj совпадает с di заболеванием:

где pj – медицинский профиль санатория.
Данное условие позволяет системе выбрать санатории, которые специализируются хотя бы на одном из отмеченных пользователем заболеваний. Это позволяет предоставлять рекомендации даже при неполном совпадении профилей, что критически важно для пациентов с редкими диагнозами либо с комплексными патологиями (например, сочетание дерматологических и кардиологических проблем). При этом для редких заболеваний система предлагает варианты лечения даже в том случае, если ни один санаторий полностью не соответствует запросу. В случае сочетанных заболеваний система найдет учреждения, где лечат хотя бы одну из этих проблем.
Для решения данной задачи использовался алгоритм K-средних (K-Means) из библиотеки ScikitLearn [9]. Основной особенностью реализации была кластеризация по признакам (уровень сервиса и стоимость проживания), а также определение количества кластеров от 1 до 4 в зависимости от размера выборки.
Именно метод K-средних идеально отражает зависимость между гибкостью критериев, динамическим обновлением и удобством ввода для обычного обывателя [10; 11]. На рисунке 2 изображен принцип использования данного метода.
Для предложения альтернатив использовался метод косинусного сходства, оценивающий семантическую близость текстовых профилей. Данный метод является достаточно эффективным для сравнения текстовых профилей небольшой длины [12]. Основное преимущество применения косинусного сходства – инвариантность к масштабу. Сходство между векторами разной длины, но одного направления будет высоким [13; 14].
Критерий выбора количества кластеров определяется технологией метода k-средних. При этом количество кластеров задается при запуске алгоритма обработки и может меняться при необходимости. В данном случае оптимальным количеством с точки зрения визуализации результата является разбиение на четыре кластера.

Рис. 2. Метод k-средних Источник: составлено авторами на основе данного исследования
Оценка качества алгоритма кластеризации была проведена с применением метрики качества «коэффициент Силуэтта». Такая оценка позволяет понять, насколько релевантна полученная выборка. Метрика оценивает качество алгоритма на основе сравнения условного расстояния между объектами кластера и между объектами разных кластеров. Качество кластеризации может быть оценено как высокое, если результат расчета метрики близок к единице. Расчеты коэффициента Силуэтта показали релевантность применяемого метода. Коэффициент Силуэтта для данного исследования составляет 0,87.
Метод кластеризации представляет собой оптимальный баланс между точностью, скоростью и интерпретируемостью [15]. Обработка данных с применением этого метода показала высокую эффективность при решении поставленной задачи и позволила сформировать интерфейс программного продукта.
Результаты исследования и их обсуждение
Важным этапом анализа результатов кластеризации является визуализация вывода. Метод визуализации позволяет показать пользователю выборку санаториев на основе применяемой методики. На рисунке 3 представлен график результата кластеризации санаториев по цене и уровню сервиса, где размер и цвет маркеров делают выводы более наглядными, а надпись соответствует названию санатория.
При построении графика применяется принцип многомерного представления информации, где конкретно каждый тип данных кодируется отдельным свойством с визуальными критериями [16; 17]. Это позволяет без потери читаемости совместить на одном графике несколько измерений.

Рис. 3. График кластеризации по цене и уровню сервиса Источник: составлено авторами на основе данного исследования
Размер маркеров показывает стоимость. Логично, что чем больше санаторий, тем он дороже. Это интуитивно понятно, так как люди обычно соотносят размер с величиной. Тем самым пользователь может сразу отфильтровать маркеры на основе своего бюджета.
Цвет маркеров соответствует городу. Это помогает группировать санатории по географическому признаку. Если пользователь предпочитает определенный регион, он сразу может обратить внимание на маркеры нужного цвета. Важно подчеркнуть, что использование разных цветов упрощает идентификацию и сравнение между кластерами, тем самым пользователь может выбрать в одном городе схожие по сервису, но разные по цене санатории.
Подписи с названиями санаториев необходимы для точной идентификации каждого пункта на графике. Они работают как «якоря», связывая визуальные элементы с текстовой информацией [18]. Даже при близком расположении точек пользователь точно идентифицирует каждый санаторий. Для улучшения восприятия графика подобран шрифт, а также выполнено выравнивание по правому краю, предотвращающее наложение текста. Данный подход позволяет устранить хаотичность картины, минимизируя накладки надписей друг на друга. Это позволяет избежать пересечения информационных объектов [19].

Рис. 4. Интерактивный интерфейс при выборе пользователем профиля лечения «Гинекология» Источник: составлено авторами на основе данного исследования

Рис. 5. Интерактивный интерфейс при выборе пользователем профиля лечения «Сердечно-сосудистая система» Источник: составлено авторами на основе данного исследования
Спектр методов визуализации обширен и не ограничивается предлагаемой картиной. Такой популярный инструмент, как тепловые карты, в данном случае неэффективен, так как система работает с дискретными данными (уровень сервиса – целые числа). Применение столбчатых диаграмм затруднит визуальный анализ большого количества объектов по нескольким категориям.
Предлагаемая методика визуализации наиболее эффективна в данной постановке задачи. Сочетание цвета, размера и текстовых меток маркеров на точечном графике формирует информационно-эффективный, а также интуитивно понятный интерфейс для обычного пользователя. Данный выбор сделан на основе анализа альтернативных способов визуализации (тепловые карты, столбчатые и круговые диаграммы) и соответствует задаче сравнения объектов по двум ключевым параметрам [20].
Интерактивный интерфейс представлен скриншотами программы. Рассматривается случай, когда пользователь выбирает профиль лечения «Гинекология» (рис. 4). Еще один скриншот показывает процесс анализа при выборе профиля «Сердечно-сосудистая система» (рис. 5).
Для взаимодействия с пользователем используется виджет SelectMultiple из библиотеки ipywidgets. Динамическое изменение критериев позволяет пользователю экспериментировать с разными комбинациями заболеваний и сразу видеть, как меняются рекомендации [21]. Эта интерактивность делает систему более гибкой и отзывчивой, что улучшает пользовательский опыт.
Заключение
Данная разработка не только упрощает навигацию в выборе лечебного учреждения, но и повышает точность рекомендаций за счет исключения человеческого фактора. Предлагаемая методика минимизирует риски некорректного подбора терапии, что критично для эффективной реабилитации.
В данной работе демонстрируются возможности применения искусственного интеллекта в разработке рекомендательных систем. Тестирование алгоритмов анализа данных и работа с интерфейсом приложения показали релевантность предлагаемого метода. Автоматизированная рекомендательная система по подбору оздоровительного отдыха является экспертной системой с базой знаний. Такую систему можно доработать в следующей итерации до формата интеллектуального агента-советчика. Формат генератора рекомендаций по профилю лечения является своевременным предложением.
Основной проблемой разработки такого генератора является состав определяющих решение пользователя параметров санаторно-курортного отдыха. Решение проблемы заключается в применении технологий кластеризации. Искусственный интеллект определяет эффективный набор признаков, которые будут использованы в качестве фильтров выбора санатория. Расчет метрик качества кластеризации на основе коэффициента Силуэтта показал релевантность применяемых методов.
Технологии искусственного интеллекта позволили сформировать эргономичный и интуитивно доступный интерфейс программного приложения. Пользователь получает доступ к выбору профиля лечения в санатории, ему предоставляется визуальная картина результатов выбора. Таким образом, технологии машинного обучения позволяют существенным образом упростить процессы анализа данных и непосредственно разработку программных приложений.
Конфликт интересов
Благодарности
Библиографическая ссылка
Ковалева А.О., Мартиросян К.В., Цаплева В.В., Суюнова Г.Б. РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ПО ПОДБОРУ ОЗДОРОВИТЕЛЬНОГО ОТДЫХА В РЕГИОНЕ КАВКАЗСКИХ МИНЕРАЛЬНЫХ ВОД НА ОСНОВЕ АНАЛИЗА МЕДИЦИНСКИХ ПРОФИЛЕЙ И СТОИМОСТНЫХ ХАРАКТЕРИСТИК // Современные наукоемкие технологии. 2025. № 11. С. 81-87;URL: https://top-technologies.ru/ru/article/view?id=40570 (дата обращения: 13.12.2025).
DOI: https://doi.org/10.17513/snt.40570



