Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,172

APPLICATION OF MACHINE LEARNING ON GRAPHS TO CONSTRUCTING RECOMMENDATION SYSTEMS THAT TAKE INTO ACCOUNT USER INDIVIDUALITY

Khasanov I.I. 1 Khasanova Z.R. 1
1 Financial University under the Government of the Russian Federation
1498 KB
In the context of rapid growth in cargo transportation volumes and increasing complexity of logistics processes, the introduction of intelligent technologies capable of adapting to rapidly changing market requirements is becoming especially relevant. One such solution is the use of machine learning methods on graphs to build recommender systems in logistics. The purpose of this work is to study the capabilities of personalized graph models designed to optimize logistics processes through a more accurate selection of routes, carriers and related services, taking into account the individual preferences of participants in the logistics chain. The paper examines the use of graph machine learning methods to build recommender systems in the field of transport logistics, taking into account the individual preferences of users. An approach to the personalization of graph models is proposed based on the integration of user characteristics and dynamic recalculation of link weights in the graph. The developed model allows optimizing logistics processes, increasing the relevance of recommendations for the selection of routes and carriers. The effectiveness of the proposed method is confirmed by experimental results on real data: the values of Precision 88%, Recall 81% and NDCG 0.94 were achieved. The presented results demonstrate the advantages of the developed system compared to traditional methods of logistic planning in a dynamically changing environment.
graph
machine learning
recommender systems
personalization
logistics
routes
transport networks

Введение

Сегодня в современных условиях компьютеризации производства и глобализации экономики динамично формируется новый цифровой уклад: осуществляется цифровизация экономических процессов и внедрение инновационных технологий во все сферы деятельности, в том числе в транспортную логистику, которая решает задачи планирования, реализации и контроля перемещения грузов и включает в себя выбор оптимальных маршрутов, средств передвижения и методов доставки [1, 2].

Современные логистические системы грузоперевозок становятся всё более сложными и требуют интеллектуальных решений для оптимизации маршрутов, выбора транспортных средств и прогнозирования спроса. Одним из перспективных направлений является использование графовых методов машинного обучения, позволяющих учитывать сложные взаимосвязи между участниками системы: клиентами, перевозчиками, пунктами погрузки и выгрузки, дорогами и другими параметрами. Графовые нейронные сети эффективно обрабатывают сложные структуры данных и демонстрируют хорошие результаты в задачах, где важно учитывать взаимосвязи между элементами [3, 4]. Переход на автоматизированные системы, исключая влияние человеческого фактора, позволяет в сотни раз быстрее и эффективнее решать сложные задачи оптимизации [5].

Рекомендательные системы, построенные на графах, могут помогать транспортным компаниям и грузоотправителям находить оптимальные маршруты, наиболее подходящих перевозчиков, рекомендовать альтернативные логистические схемы и прогнозировать загрузку транспортных коридоров с учётом индивидуальных предпочтений и исторических данных. Графы позволяют формализовать процесс исследования инвариантных во времени свойств системы и использовать хорошо развитый математический аппарат теории графов, позволяющий компьютеризировать анализ структуры [6]. Постепенное внедрение в отрасль логистики и транспорта позволит в значительной степени повысить эффективность работы и производительность труда различных хозяйствующих субъектов [7].

Исходя из вышеописанного, целью данного исследования является разработка и анализ методов применения машинного обучения на графах для построения рекомендательных систем в сфере грузоперевозок, учитывающих индивидуальные потребности пользователей, такие как грузоотправители, перевозчики и логистические компании.

В связи с этим предложена модель графовых методов машинного обучения для построения рекомендательных систем в сфере грузоперевозок, учитывающих индивидуальные потребности пользователей и динамическую изменчивость логистической сети. В отличие от традиционных моделей оптимизации логистики, предложенный подход учитывает изменения в логистических потоках в реальном времени (например, пробки, новые заказы, отмены рейсов). Был исследован метод машинного обучения на графах, математического моделирования и анализа данных, позволяющие построить рекомендательную систему для оптимизации грузоперевозок с учётом индивидуальных предпочтений пользователей. Предлагаемая модель применения графовых методов машинного обучения для построения рекомендательных систем в сфере грузоперевозок позволяет оптимизировать логистические процессы, повысить эффективность транспортных операций и персонализировать взаимодействие участников рынка.

Цель исследования – разработка и анализ методов применения графовых методов машинного обучения для построения рекомендательных систем в сфере грузоперевозок, которые учитывают индивидуальные потребности пользователей (грузоотправителей, перевозчиков и логистических компаний), а также динамическую изменчивость логистической сети в реальном времени.

Материалы и методы исследования

Данное исследование в области применения графовых методов машинного обучения для построения рекомендательных систем, учитывающих индивидуальность пользователей в логистике, было проведено на основе системного анализа научной литературы, открытых источников данных и современных подходов к моделированию сложных сетевых структур.

Результаты исследования и их обсуждение

Грузоперевозки являются одной из ключевых отраслей экономики, обеспечивающей транспортировку товаров по стране и за её пределами. В условиях глобализации и цифровизации логистических процессов возрастает необходимость в применении интеллектуальных систем для оптимизации маршрутов, прогнозирования загруженности транспортных узлов и повышения эффективности взаимодействия между участниками логистической цепочки.

Современным решением для таких задач является использование методов машинного обучения на графах, которые позволяют анализировать сложные взаимосвязи между грузоотправителями, перевозчиками, маршрутами и логистическими узлами, а также строить персонализированные рекомендации для клиентов и транспортных компаний.

Одним из ключевых преимуществ рекомендательных систем на основе графовых моделей является их способность учитывать сложные зависимости между различными элементами логистической сети. Это позволяет системе анализировать не только отдельные компоненты, но и взаимодействия между ними, что важно для принятия комплексных решений.

Один из способов персонализации – это включение пользовательских данных в структуру графа [8, с. 109; 9, с. 68].

Основные типы данных для персонализации:

− профильные данные: возраст, регион, язык, профессия;

− история заказов: прошлые маршруты, часто используемые перевозчики;

− поведение: предпочтения по цене, скорости доставки, рейтингу.

− социальные связи: пользователи с похожими предпочтениями.

В рамках данного исследования задача построения рекомендательной системы для персонализированной маршрутизации в логистике формализуется как задача оптимизации на ориентированном графе с весами, зависящими от индивидуальных характеристик пользователя согласно формуле (1).

G = (V,E). (1)

Каждому ребру (u,v) ∈ E сопоставляются параметры:

− duv ∈ R+ – расстояние;

− tuv ∈ R+ – время в пути;

− cuv ∈ R+ – стоимость;

− ruv ∈ [0,1] – коэффициент надежности маршрута.

На основе этих данных определяется функция веса маршрута с учётом предпочтений пользователя. Вес ребра рассчитывается по формуле (2).

missing image file, (2)

где f(p,u,v) – функция персонализации, понижающая вес при совпадении с регионом интереса или критерием;

gγ(u,v) ∈ {duv , tuv , cuv} – выбранный критерий оптимизации;

α∈[0,1] – коэффициент учёта индивидуальности пользователя.

Тогда задача минимизации формулируется выражением (3):

missing image file. (3)

Для повышения качества персонализации и предсказания связей между объектами в графе применяется архитектура GNN, позволяющая учитывать как локальные, так и глобальные зависимости между узлами. Векторное представление узла обновляется по следующему правилу (4) [10]:

missing image file (4)

где missing image file – векторное представление пользователя на слое l;

W(l)– матрица весов модели;

N(u) – соседи узла u в графе;

σ – функция активации (например, ReLU).

Индивидуальные характеристики пользователей интегрируются в графовую модель, улучшая персонализацию.

Еще один способ персонализации – это изменение весов рёбер в графе в зависимости от предпочтений пользователей.

Формула для пересчета весов рёбер представляется в виде (5) [11, с. 62, 12, с. 251-271, 13]:

missing image file, (5)

где f(u,v) – функция предпочтений пользователя;

ω0 – изначальный вес связи;

α – параметр, контролирующий степень персонализации.

Чтобы достичь наилучших результатов, можно комбинировать методы персонализации.

В рамках реализации предложенного метода был разработан прикладной программный комплекс в виде интерактивного десктопного приложения, реализующего рекомендательную систему маршрутов. Архитектура комплекса представлена на рис. 1.

Система реализована в виде клиент-серверного приложения, включающего модуль ввода пользовательских предпочтений, сервер FastAPI для обработки запросов, компонент извлечения профиля пользователя, графовую нейросетевую модель, блок формирования графа маршрутов и модуль визуализации. Такая модульная структура обеспечивает масштабируемость, адаптивность к изменениям входных параметров и возможность интеграции дополнительных алгоритмов персонализации.

В данной работе целью было подтвердить эффективность персонализированных графовых моделей на реальных данных и оценить их преимущества перед традиционными методами. В рамках исследования была разработана персонализированная рекомендательная система на основе графов, в которой учитываются индивидуальные предпочтения пользователей, их поведение и связи с объектами (маршруты, товары, услуги, перевозчики и т. д.).

На основе этой структуры реализованы модели машинного обучения, использующие архитектуры графовых нейронных сетей и алгоритмы персонализированного ранжирования. Особое внимание уделено исследованию методов персонализации, включая модификацию весов связей в графе и интеграцию пользовательских характеристик [14]. Качество работы системы оценивалось с применением совокупности метрик, отражающих точность, полноту, релевантность и разнообразие рекомендаций.

missing image file

Рис. 1. Архитектура программного комплекса персонализированной рекомендательной системы маршрутов Источник: составлен авторами

Структура данных

Название

Описание

Тип данных

UserID

ID пользователя

Целочисленный

RouteID

ID маршрута

Целочисленный

CarrierID

ID перевозчика

Целочисленный

Cost

Стоимость маршрута

Числовой

Time

Время в пути

Числовой

Rating

Оценка пользователя (0-5)

Числовой

UserPreferences

Предпочтения пользователя (например, быстрая доставка, низкая цена)

Категориальный

Примечание: составлена авторами.

Результаты были дополнительно проанализированы, что позволило выявить ключевые особенности структуры графа и закономерности в поведении пользователей. Полученные данные свидетельствуют о высокой адаптивности предложенного подхода к изменяющимся условиям логистической среды и его способности учитывать индивидуальные предпочтения различных участников транспортной системы.

Формат представления данных в графе (таблица):

− пользователь (User) соединен с маршрутом (Route), если он делал заказ;

− маршрут (Route) связан с перевозчиком (Carrier);

− связи взвешены параметрами (время, стоимость, рейтинг).

User A → Route 1 → Carrier X

User B → Route 2 → Carrier Y

В процессе моделирования была представлена графовая модель системы грузоперевозок, которая позволяет визуализировать и анализировать взаимосвязи между маршрутами и перевозчиками (рис. 2).

Структура графа демонстрирует высокую связность логистической сети, наличие множественных альтернативных маршрутов. Такая модель используется для дальнейшей маршрутизации, анализа загруженности и оценки оптимальности рекомендованной системы.

Для оценки взаимозависимостей между параметрами маршрутов была построена корреляционная матрица, представленная на рис. 3.

missing image file

Рис. 2. Графовая структура системы грузоперевозок Источник: составлен авторами

missing image file

Рис. 3. Корреляционная матрица параметров маршрутов Источник: составлен авторами

missing image file

Рис. 4. Распределение стоимости в зависимости от уровня надёжности Источник: составлен авторами

Анализ матрицы показывает низкие значения корреляций между основными признаками, такими как расстояние, время, стоимость, надёжность и погодные условия. Это свидетельствует о слабой линейной зависимости между параметрами, что делает неэффективным применение классических моделей регрессии. В таких условиях целесообразно использовать графовые нейросетевые модели, способные извлекать скрытые и нелинейные зависимости между объектами на основе структуры связей. Полученные результаты подтверждают необходимость применения GNN-подходов в построении рекомендательной системы для маршрутов, учитывающей множественные, слабо коррелированные признаки.

На основе графика плотности показано влияние надежности на распределение стоимости маршрутов. Видно, что при разных значениях надёжности наблюдается вариативность стоимости, что может свидетельствовать о влиянии фактора надёжности на ценообразование (рис. 4).

Визуальное распределение точек по уровням надёжности показывает, что маршруты с более высокой надёжностью (например, Reliability = 0.9) не обязательно имеют более высокую или низкую стоимость по сравнению с менее надёжными. Это говорит о независимости параметра надёжности от стоимости и расстояния, что подтверждает результаты корреляционного анализа.

Таким образом, надёжность маршрута представляет собой автономный признак, который следует учитывать при построении модели рекомендаций как отдельную характеристику маршрута, а не как производную от стоимости или расстояния. Это обосновывает использование многомерного анализа и графовых моделей, способных учитывать множественные слабосвязанные признаки при построении персонализированных рекомендаций.

Полный процесс работы системы:

1. Сбор данных о маршрутах и перевозчиках.

2. Формирование графа перевозок с учетом веса рёбер (стоимость, время, надежность).

3. Оптимизация маршрутов:

− вычисление PageRank (лучшие маршруты);

− вычисление Link Prediction (предсказание новых связей).

4. Формирование рекомендаций перевозчиков клиентам.

5. Оценка качества рекомендаций.

Завершающим этапом процесса стала оценка эффективности рекомендательной системы, проведённая с использованием трёх ключевых метрик качества предсказаний [15, с. 316]:

missing image file

Рис. 5. Метрики Precision@K, Recall@K и NDCG@K Источник: составлен авторами

− Precision – это доля релевантных перевозчиков среди K предложенных системой рекомендаций. Полученные значения при моделировании Precision = 88% означает, что среди 5 предложенных системой перевозчиков 88% действительно были полезны и соответствовали ожиданиям пользователя. Чем выше Precision, тем более точные рекомендации даёт система.

− Recall – показывает, насколько хорошо модель охватывает все возможные релевантные перевозчики. Полученные значения Recall = 81% означает, что 81% всех возможных подходящих перевозчиков были найдены среди 5 лучших рекомендаций. Высокий Recall означает, что модель не пропускает важные варианты, но может предлагать лишние.

− NDCG – показывает, насколько правильно упорядочены рекомендации.

Полученные значения NDCG = 0.94 означает, что 94% рекомендаций были выданы в правильном порядке, т.е. самые релевантные перевозчики оказались на первых местах.

На основании обученности модели построены графики Precision, Recall и NDCG, чтобы проанализировать, как изменяется качество модели на разных K (рис. 5).

Заключение

В работе предложена и экспериментально подтверждена эффективность персонализированной рекомендательной системы, построенной на графовых методах машинного обучения.

Предложен метод персонализации весов графа маршрутизации, учитывающий как профиль пользователя (бюджет, приоритет критериев, региональные предпочтения), так и динамику логистической сети. В отличие от традиционных графов с фиксированными весами, в модели осуществляется адаптивный пересчёт весов на основе функции предпочтений, что позволяет формировать индивидуальные маршруты в условиях неопределённости и ограничения ресурсов.

Интегрирована архитектура графовой нейронной сети для представления сложных связей между пользователями, маршрутами и перевозчиками. Использование GNN позволяет учитывать многомерные и слабо коррелированные признаки, а также распространять информацию между соседними узлами графа для повышения качества рекомендаций.

Разработан прототип прикладной рекомендательной системы, реализующий описанную модель в виде десктопного приложения. Комплекс программ предоставляет визуализацию маршрутов, персонализированные рекомендации и инструменты анализа сети на основе реальных координат и параметров маршрутов.

Проведён экспериментальный анализ, включающий сравнение персонализированного и базового подходов по метрикам Precision, Recall и NDCG, что позволило эмпирически подтвердить эффективность предложенного метода.

Таким образом, представленная графовая модель грузоперевозок позволяет наглядно проанализировать транспортные связи, выявить ключевых участников рынка и предложить пути оптимизации доставки грузов.