ПРИМЕНЕНИЕ МЕТОДОВ СОВМЕСТНОЙ ФИЛЬТРАЦИИ В РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЕ ГЕОПОРТАЛА

Климонов М.С. 1

1 Федеральное государственное бюджетное учреждение науки «Институт динамики систем и теории управления имени В.М. Матросова» Сибирского отделения Российской академии наук

Климонов М.С. - разработка концепции, работа с данными, анализ данных, проведение исследования, методология исследования, разработка программного обеспечения, визуализация результатов, написание черновика рукописи, написание рукописи – рецензирование и редактирование

Современные геопорталы предоставляют пользователям широкий набор сервисов для работы с пространственными данными, однако разнообразие этих инструментов затрудняет выбор подходящего сервиса под конкретную задачу. В связи с этим возникает необходимость внедрения рекомендательной системы, способной персонализировать подбор сервисов для пользователей. Целью настоящего исследования является разработка и сравнительная оценка алгоритмов рекомендательной системы для построения научных процессов обработки пространственных данных геопортала на основе методов совместной фильтрации. В работе использованы реальные данные о взаимодействиях пользователей с сервисами, на основе которых сформирована разреженная матрица «пользователь – сервис». Оценка эффективности алгоритмов производилась с использованием общепринятых метрик точности, полноты и качества ранжирования. В рамках исследования реализованы и проанализированы 14 алгоритмов рекомендаций различных классов: от простых неперсонализированных до гибридных и нейросетевых моделей. Выявлено, что наилучшие результаты демонстрируют гибридные методы, в частности алгоритм, объединяющий подходы на основе сходства пользователей и объектов и оптимизирующий качество ранжирования. Разработанная система рекомендаций повышает релевантность предложений для пользователей и может служить эффективным инструментом поддержки научной деятельности на геопортале за счет персонализированного подбора сервисов.

Статья в формате PDF

869 KB

коллаборативная фильтрация

рекомендательная система

сервисы обработки данных

метод ближайших соседей

геопортал

1. Федоров Р.К., Бычков И.В., Шумилов А.С., Ружников Г.М. Система планирования и выполнения композиций веб-сервисов в гетерогенной динамической среде // Вычислительные технологии. 2016. Т. 21. № 6. С. 18–35.

2. Crusoe J., Simonofski A., Clarinval A. and Gebka E. The Impact of Impediments on Open Government Data Use: Insights from Users, 2019 13th International Conference on Research Challenges in Information Science (RCIS), Brussels, Belgium, 2019. P. 1–12. DOI: 10.1109/RCIS.2019.8877055.

3. Ziaimatin H., Nili A., Barros A. Reducing Consumer Uncertainty: Towards an Ontology for Geospatial User-Centric Metadata // ISPRS International Journal of Geo-Information. 2020. Vol. 9. Is. 8. Art. 488. DOI: 10.3390/ijgi9080488.

4. Vahdat A., Badard T., Pouliot J. A Semantic Collaborative Filtering-Based Recommendation System to Enhance Geospatial Data Discovery in Geoportals // ISPRS International Journal of Geo-Information. 2025. Vol. 14 (12). Art. 495. DOI: 10.3390/ijgi14120495.

5. Suganeshwari G., Syed Ibrahim S. P. A survey on collaborative filtering based recommendation system // Smart Innovation, Systems and Technologies. 2016. Vol. 49. P. 503–518. (Proceedings of the 3rd International Symposium on Big Data and Cloud Computing Challenges, Vellur, India, 10–11 March 2016). Cham: Springer, 2016. DOI: 10.1007/978-3-319-30348-2_42.

6. Chen R., Hua Q., Chang Y.-S., Wang B., Zhang L., Kong X. A Survey of Collaborative Filtering-Based Recommender Systems: From Traditional Methods to Hybrid Methods Based on Social Networks // IEEE Access. 2018. Vol. 6. P. 64301–64320. DOI: 10.1109/ACCESS.2018.2877208.

7. Li Y., Jiang Y., Yang C. и др. Improving search ranking of geospatial data based on deep learning using user behavior data // Computers & Geosciences. 2020. Vol. 142. Art. 104520. DOI: 10.1016/j.cageo.2020.104520.

8. Климонов М.С., Федоров Р.К. Рекомендательная система для выбора сервисов на геопортале ИДСТУ СО РАН // Информационные и математические технологии в науке и управлении. 2025. № 2 (38). С. 199–207. DOI: 10.25729/ESI.2025.38.2.016.

9. Nguyen L.V., Vo Q.-T., Nguyen T.-H. Adaptive KNN-Based Extended Collaborative Filtering Recommendation Services // Big Data and Cognitive Computing. 2023. Vol. 7 (2). Art. 106. DOI: 10.3390/bdcc7020106.

10. Fkih F. Similarity measures for Collaborative Filtering-based Recommender Systems: Review and experimental comparison // Journal of King Saud University – Computer and Information Sciences. 2022. Vol. 34. Is. 9. P. 7645–7669. DOI: 10.1016/j.jksuci.2021.09.014.

11. Dareshiri S., Farnaghi M., Sahelgozin M. A recommender geoportal for geospatial resource discovery and recommendation // Journal of Spatial Science. 2019. Vol. 64. Is. 1. P. 49–71. DOI: 10.1080/14498596.2017.1397559.

12. Ahmadian S., Berahmand K., Rostami M., Forouzandeh S., Moradi P., Jalili M. Recommender Systems Based on Non-negative Matrix Factorization: A Survey // IEEE Transactions on Artificial Intelligence. 2025. Vol. 6. Is. 10. P. 2554–2574. DOI: 10.1109/TAI.2025.3559053.

13. Hu Y., Koren Y., Volinsky C. Collaborative Filtering for Implicit Feedback Datasets // Proceedings of the 2008 Eighth IEEE International Conference on Data Mining (ICDM). 2008. P. 263–272. DOI: 10.1109/ICDM.2008.22.

14. He X., Liao L., Zhang H., Nie L., Hu X., Chua T.-S. Neural Collaborative Filtering // Proceedings of the 26th International Conference on World Wide Web (WWW 2017). 2017. P. 173–182. DOI: 10.1145/3038912.3052569.

15. Guo H., Tang R., Ye Y., Li Z., He X. DeepFM: A Factorization-Machine Based Neural Network for CTR Prediction // Proceedings of the 26th International Joint Conference on Artificial Intelligence (IJCAI 2017). 2017. P. 1725–1731. DOI: 10.24963/ijcai.2017/239.

16. Kula M. Metadata Embeddings for User and Item Cold-start Recommendations [Электронный ресурс] // arXiv. 2015. arXiv:1507.08439. URL: https://arxiv.org/abs/1507.08439 (дата обращения: 17.01.2026). DOI: 10.48550/arXiv.1507.08439.

17. Jiang Y., Liu J., Tang M., Liu X. An Effective Web Service Recommendation Method Based on Personalized Collaborative Filtering // Proceedings of the IEEE International Conference on Web Services (ICWS). 2011. DOI: 10.1109/ICWS.2011.38.

18. Rendle S., Freudenthaler C., Gantner Z., Schmidt-Thieme L. BPR: Bayesian Personalized Ranking from Implicit Feedback // Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence. Montreal, Canada, 2009. P. 452–461. DOI: 10.5555/1795114.1795167.

19. Zhang S., Yao L., Sun A., Tay Y. Deep learning based recommender system: a survey and new perspectives // ACM Computing Surveys. 2019. Vol. 52. Is. 1. Art. 5. P. 1–38. DOI: 10.1145/3285029.

Введение

Геопорталы представляют собой комплексные информационные системы, предоставляющие пользователям доступ к различным сервисам для работы с пространственными данными. На геопортале Института динамики систем и теории управления Сибирского отделения Российской академии наук (ИДСТУ СО РАН) разработан широкий набор веб-сервисов [1], позволяющих выполнять поиск, визуализацию и анализ разнообразных данных. Такое многообразие доступных инструментов, с одной стороны, расширяет возможности пользователя, но с другой – усложняет навигацию и выбор нужного сервиса под конкретную задачу. Возникает необходимость внедрения механизма персонализации, который облегчал бы пользователям поиск релевантных сервисов.

Основными пользователями данного геопортала являются научные сотрудники, применяющие предоставляемые сервисы как по отдельности, так и последовательно (в виде научных процессов, цепочек вызовов сервисов) для решения прикладных исследовательских задач. На практике было отмечено, что обилие доступных сервисов затрудняет быстрый выбор подходящего инструмента, особенно новых (ранее не использованных) сервисов. В этих условиях актуальной задачей становится разработка рекомендательной системы, способной автоматически предлагать каждому пользователю наиболее подходящие сервисы на основе анализа истории взаимодействий (поведения) и предпочтений без необходимости формулирования поискового запроса [2].

Современные рекомендательные системы строятся на различных методах анализа данных. Наиболее распространены подходы на основе контента, знаний, статистики, правил, а также совместной (коллаборативной) фильтрации (Collaborative Filtering, CF). Методы на основе знаний и статистики можно назвать базовыми, так как они не учитывают скрытых закономерностей (предпочтений) о поведении пользователя на геопортале. Методы на основе контента и метаинформации требуют глубокого погружения в систему понятий геопортала, логику работы самого сервиса для описания, требуют дополнительных затрат ресурсов на валидацию описаний [3, 4]. Методы пользовательской CF используют информацию о поведении пользователей на портале (прошлых взаимодействиях с объектами, например оценки сервисов или факты использования) для выявления скрытых закономерностей и формирования персональных рекомендаций [5, 6].

Преимущество совместной фильтрации состоит в том, что она не требует явного описания содержимого сервисов, а опирается на сходство между пользователями или объектами, выявленное из имеющихся данных о предпочтениях [6]. Например, если два пользователя использовали много одинаковых сервисов, то сервис, который впервые вызван первым пользователем и еще не был вызван вторым, может быть рекомендован второму – исходя из предположения, что у пользователей со схожими интересами будут совпадать и другие предпочтения [7].

Учитывая перечисленные преимущества, в качестве основы для рекомендательной системы выбран подход совместной фильтрации. В более ранней работе [8] был представлен прототип рекомендательной системы для геопортала ИДСТУ СО РАН на базе метода ближайших соседей. Это решение продемонстрировало принципиальную возможность улучшения процесса поиска сервисов за счет персонализации с помощью коллаборативной фильтрации.

Формально задача рекомендации сервисов может быть сведена к ранжированию множества сервисов S для каждого пользователя u ∈ U согласно некоторой функции релевантности, при этом |S| = m, |U| = n. Цель – построить функцию представленную в формуле

r : U×S→[0,1],

которая для пары «пользователь – сервис» возвращает степень релевантности сервиса данному пользователю (0 означает полное несоответствие потребностям, 1 – максимальную релевантность).

Цель исследования – разработка и экспериментальная оценка системы рекомендаций веб-сервисов обработки пространственных данных для распространения информации (рекомендации тех сервисов, что пользователь еще не использовал, но использовали другие пользователи со схожим научным интересом) на геопортале.

Материалы и методы исследования

Данные и подготовка. На геопортале организован сбор статистики использования сервисов: регистрируется каждое обращение пользователя к сервису (с указанием времени, идентификаторов и пр.). Эти данные о поведении пользователей трансформируются в матрицу «пользователь – сервис» Q, где элементом qij служит нормированное количество вызовов cij сервиса sj пользователем ui. Таким образом каждый пользователь ui описывается вектором qi = {qi1, …, qim }. Полученная матрица взаимодействий является разреженной, поскольку каждый конкретный пользователь использует лишь небольшой поднабор из множества доступных сервисов. Таким образом, на основе накопленных логов использования формируется датасет, служащий исходной информацией для алгоритмов коллаборативной фильтрации.

В выборке присутствуют взаимодействия 19 (n) пользователей с 199 (m) различными сервисами (всего зафиксировано 11 055 событий обращения к сервисам). Данные были разбиты на обучающую и тестовую части в соотношении 70/30. При разделении использовался временной принцип: отсортированные по времени взаимодействия первых 70 % составили обучающую выборку, а последние 30 % – тестовую.

Обучающая выборка позволила алгоритмам зафиксировать существующие закономерности в поведении пользователей и сформировать прогнозные модели предпочтений, тогда как тестовая часть имитировала появление новых взаимодействий, ранее неизвестных системе. Для каждого пользователя на основе обученной модели формировался список наиболее вероятных к использованию сервисов, с которыми он ранее не взаимодействовал. Сформированный список рекомендаций отражает предполагаемые будущие интересы и служит инструментом персонализированного выбора. Сравнение предсказанных рекомендаций с реальными обращениями пользователей из тестовой выборки дало возможность объективно оценить, насколько корректно каждая модель предсказывает будущее поведение и обеспечивает персонализированный выбор сервисов.

Метрики оценки. Для оценки рекомендаций использовались следующие метрики (вычислялись по топ-k рекомендациям для k = 5,10,15, затем усреднялись).

Точность (Precision@k): доля рекомендованных элементов из топ-k, которые оказались релевантными (то есть действительно использованы пользователем). Высокое значение Precision@k означает, что среди рекомендаций мало нерелевантных элементов.

Полнота (Recall@k): доля релевантных элементов, которые были найдены среди топ-k рекомендаций. Высокое значение Recall@k означает, что рекомендационная модель покрывает значительную часть предпочтений пользователя.

Полезность (NDCG@k): Нормализованный кумулятивный прирост полезности (Normalized Discounted Cumulative Gain) – нормализованный дисконтированный кумулятивный выигрыш, учитывающий позицию релевантных элементов в списке рекомендаций. Высокий NDCG@k означает, что релевантные элементы находятся ближе к началу списка (больший вес у верхних позиций). Значение NDCG нормируется в диапазон [0, 1].

Алгоритмы рекомендации. Всего в рамках исследования реализовано и протестировано 14 алгоритмов рекомендаций – от простых базовых до современных гибридных нейронных моделей. Перечисленные алгоритмы можно сгруппировать по категориям следующим образом:

− Базовые подходы: Popular (рекомендует самые популярные в системе сервисы по общей частоте использования) и Random (случайное ранжирование сервисов для каждого пользователя). Эти неперсонализированные стратегии служат ориентирами: модель Popular отражает максимум возможной полноты (Recall) при минимальной персонализации, а Random показывает нижнюю границу качества («без модели»).

− Memory-based совместная фильтрация: алгоритм на основе k ближайших соседей (user-based KNN) [6, 9]. Для каждого пользователя находятся несколько наиболее похожих по истории предпочтений пользователей, и ему рекомендуются сервисы, которые уже используются этими «соседями» [10]. В реализации использовался k = 4, метрика сходства – евклидово расстояние.

− Матричная факторизация: модели SVD, PCA, ALS, WRMF и NMF. Эти методы разлагают матрицу взаимодействий на матрицы меньшей размерности, выявляя скрытые (латентные) факторы пользователей и сервисов. Каждый пользователь и сервис представляются вектором в пространстве этих факторов, а степень интереса определяется, например, скалярным произведением соответствующих векторов. Классические методы SVD (сингулярное разложение матрицы) и ALS (чередующиеся наименьшие квадраты) оценивают латентные характеристики, оптимизируя приближение исходной матрицы рейтингов [4, 11]. Метод NMF (неотрицательное матричное разложение) накладывает неотрицательные ограничения на факторы, облегчая интерпретацию. Вариант WRMF (Weighted Regularized MF) модифицирует ALS для неявной обратной связи, вводя веса уверенности в наблюдаемых взаимодействиях [12, 13]. В целом модельно-ориентированные методы требуют значительных вычислений для обучения, но обеспечивают быстрое прогнозирование рейтингов после обучения.

− Нейросетевая модель: NCF (Neural Collaborative Filtering). Этот подход использует многослойный перцептрон для моделирования взаимодействий между пользователями и сервисами. Пользователям и сервисам сопоставляются обучаемые эмбеддинги (векторы признаков), которые объединяются и подаются на вход нейронной сети, предсказывающей вероятность взаимодействия [14]. Обучение NCF проводится на неявных данных (факт использования сервисов) с негативным семплированием и функцией потерь в виде бинарной кроссэнтропии. Нелинейная модель NCF теоретически способна выразить сложные зависимости предпочтений, выходя за рамки линейной гипотезы матричной факторизации.

− Глубокая гибридная модель: DeepFM (Deep Factorization Machine). Этот алгоритм сочетает факторизационную модель с глубоким нейронным подходом. Архитектура включает два компонента: FM-часть, которая эффективно моделирует парные взаимодействия признаков (аналогично MF для идентификаторов пользователей и сервисов), и глубокую часть (MLP), выявляющую нелинейные взаимосвязи более высокого порядка. DeepFM способен учитывать разнообразные признаки пользователей и объектов (в данном исследовании явно дополнительные признаки не использовались, модель работала только с ID), объединяя преимущества факторизации и глубокого обучения [15].

− Гибридные методы CF: LightFM и PHCF. Модель LightFM [16] реализует коллаборативный подход, расширяемый содержательными признаками, и оптимизируется по специальной ранжирующей функции потерь (в данной статье использовалась WARP – Weighted Approximate-Rank Pairwise). PHCF (Personalized Hybrid CF) – персонализированный гибридный подход, комбинирующий предсказания user-based и item-based стратегий [17]. Для каждого пользователя агрегируются оценки, полученные на основе схожести с другими пользователями и на основе сходства сервисов с уже понравившимися ему. В реализованном алгоритме PHCF-BPR обучение латентных факторов выполнено через оптимизацию функции потерь BPR (Bayesian Personalized Ranking) [18], направленной на улучшение качества ранжирования рекомендаций.

− Комбинированные ансамбли: методы KNN+LightFM-WARP и KNN+PHCF-BPR объединяют подходы на основе памяти и модели. Окончательный рейтинг рассчитывается как взвешенная сумма скорингов, полученных от KNN и соответствующей модельно-ориентированной алгоритмической части (LightFM или PHCF). Такая комбинация позволяет учесть одновременно «мнение» похожих пользователей и глобальные паттерны предпочтений, полученные моделью, с целью повысить общую точность рекомендаций.

Результаты исследования и их обсуждение

Эксперименты проведены на реальных данных использования геопортала, позволяющих объективно сравнить качество рекомендаций перечисленных алгоритмов. На основе тестовой выборки вычислены средние значения Precision@10, Recall@10 и nDCG@10 для каждой модели (таблица), а также сводный суммарный показатель качества (итоговый скор), рассчитываемый как взвешенная сумма метрик с наибольшим весом у nDCG. Общий скор отражает интегральную эффективность алгоритма, делая основной упор на качество ранжирования рекомендаций.

Итоговый скор складывается по формуле 0.3∙Precision + 0.3∙Recall + 0.4∙NDCG, отражая больший акцент на качестве ранжирования. Фактически NDCG получил наибольший вес, что соответствует ключевой роли порядка рекомендаций. Корреляционный анализ метрик показывает сильную связь между Recall и NDCG (r = 0,894) и умеренную – между Precision и NDCG (r = 0,798). Это означает, что модели с высоким NDCG обычно находят больше релевантных элементов (больший Recall).

Результаты сравнения алгоритмов рекомендательных систем

Алгоритм	Precision	Recall	NDCG	Общий скор
PHCF-BPR	0,080	0,093	0,203	0,133
KNN+PHCF-BPR	0,081	0,080	0,202	0,129
LightFM-WARP	0,055	0,079	0,172	0,109
NCF	0,054	0,059	0,163	0,099
KNN	0,047	0,074	0,148	0,096
KNN+LightFM-WARP	0,046	0,070	0,126	0,085
Popular	0,066	0,038	0,114	0,077
WRMF	0,058	0,018	0,102	0,064
ALS	0,027	0,018	0,081	0,046
NMF	0,026	0,030	0,059	0,040
PCA	0,028	0,017	0,063	0,039
DeepFM	0,035	0,009	0,049	0,033
SVD	0,022	0,010	0,042	0,026
Random	0,029	0,006	0,036	0,025

Примечание: составлена авторами на основе полученных данных в ходе исследования.

Сравнение 14 алгоритмов по метрикам качества рекомендаций: Precision, Recall и NDCG (усредненные значения) Примечание: составлен авторами по результатам данного исследования

Модель PHCF-BPR обеспечила наивысший суммарный скор (0,1331) за счет сбалансированных значений Precision (0,0801), Recall (0,0929) и особенно высокого NDCG (0,2031). Гибрид KNN+PHCF-BPR занял второе место (0,1293) с наилучшим значением Precision (0,0813) и почти таким же высоким NDCG (0,2021). Третью позицию занял LightFM-WARP (общий скор 0,1089). Напротив, классические методы и нейросетевые модели показали существенно более низкие результаты: так, NCF набрал суммарный скор 0,0990, уступив LightFM-методам и находясь на уровне простого KNN (0,0957), а DeepFM с общим скором 0,0327 продемонстрировал минимальную эффективность. Базовый метод Popular показал умеренную точность (Precision 0,0661) при очень низкой полноте (Recall 0,0380), что указывает на то, что частые сервисы хорошо работают на Precision, но не покрывают все релевантные объекты. Случайная стратегия (Random) дала худшие результаты по всем метрикам, что подтверждает обоснованность использования более сложных методов.

Модель PHCF-BPR выигрывает за счет оптимизации ранжирования: ее функция потерь BPR прямо нацелена на повышение ранговой метрики. В итоге лучшие модели демонстрируют одновременно высокие значения всех трех показателей, тогда как у базовых подходов (например, Popular и KNN) или нейросетевых методов обычно наблюдается перекос в одну из метрик в условиях малого объема данных.

На рисунке представлено сравнение ключевых метрик (Precision, Recall, NDCG) для всех алгоритмов. Видно, что методы семейства PHCF опережают остальные подходы по всем показателям, особенно по Precision и NDCG. Нейронные сети (NCF) демонстрируют хорошие показатели NDCG, но несколько уступают в Precision. KNN и Popular достигают высоких значений Recall и Precision соответственно, что делает их полезными в определенных сценариях. Модели матричной факторизации (SVD, PCA, NMF, ALS, WRMF) расположены в нижней части графиков, существенно уступая более современным методам.

Выявлено явное превосходство гибридных подходов на основе BPR-оптимизации. PHCF-модели эффективно объединяют коллаборативную и содержательную составляющие (в данной работе содержательные признаки не использовались явно, но сама модель имеет регуляризующий эффект и оптимизирует ранжирование). Алгоритм PHCF-BPR достигает высокого NDCG за счет прямой оптимизации этой метрики в функции потерь. Гибрид KNN+PHCF-BPR дает наилучший Precision, поскольку учитывает как близость пользователей, так и глобальные паттерны, что улучшает точность рекомендаций. Нейронные сети (NCF, DeepFM) при столь малом объеме данных (19 пользователей) не смогли полностью реализовать свой потенциал – им, вероятно, требуется больше данных для обучения большого числа параметров. Тем не менее NCF показала себя достойно, что подтверждает эффективность даже относительно простых MLP-архитектур для коллаборативной фильтрации [19].

Выводы

Для рекомендательной системы геопортала были разработаны и протестированы рекомендательные модели для подбора новых (ранее не используемых данным пользователем) сервисов на основе методов коллаборативной фильтрации. Был проведен эксперимент, определены самые эффективные гиперпараметры для каждой модели, внедрен наиболее эффективный алгоритм рекомендации PHCF-BPR.

Разработанная рекомендательная система решает проблему поиска сервисов и распространения информации об их использовании среди специалистов одной предметной области и способна рекомендовать сервисы, которые пользуются популярностью, с учетом области интересов.

Проведенное сравнительное исследование алгоритмов показало, что подходы на основе PHCF с функцией потерь BPR демонстрируют наилучшие результаты по ключевым метрикам рекомендаций, модель значительно превосходит классические методы по точности благодаря оптимизации ранжирования, а ее гибридизация с KNN позволяет дополнительно повысить полноту и качество ранжирования рекомендаций. Нейронные методы (NCF, DeepFM) при небольшом объеме данных не достигли лидирующих позиций, однако NCF заняла достойное место, подтвердив жизнеспособность нейросетевого подхода. Простые алгоритмы (например, KNN, Popular) остаются конкурентоспособными на разреженных данных, обеспечивая относительно высокие показатели для своих классов сложности.

Основные выводы исследования:

1. Алгоритмы PHCF (BPR) превосходят классические методы – за счет прямой оптимизации ранжирования они достигают более высокой точности рекомендаций.

2. Гибридные подходы эффективны для максимизации качества – комбинация моделей (например, KNN+PHCF-BPR) позволяет улучшить одновременно Precision, Recall и NDCG за счет учета разных аспектов предпочтений.

3. Нейросетевые модели требуют больше данных – на ограниченном датасете их потенциал не раскрыт полностью, однако они способны показывать хорошие результаты при достаточном объеме взаимодействий.

4. Простые методы остаются полезными – в условиях дефицита данных или для быстрого прототипирования модели вроде Popular и KNN дают приемлемое качество при минимальной сложности.

Полученные результаты вносят вклад в понимание практической применимости различных подходов к построению рекомендательных систем и предоставляют научно обоснованные рекомендации для выбора алгоритмов в зависимости от специфики задачи и доступных ресурсов. В частности, для промышленного внедрения на рассматриваемом геопортале можно рекомендовать использовать комбинацию лучших моделей (PHCF-BPR в качестве основной, гибридный KNN+PHCF-BPR для усиления ранжирования, а также добавить NCF и KNN в ансамбль для учета разных аспектов). Для быстрых прототипов достаточно ограничиться простыми алгоритмами Popular и KNN, дополнив их моделью PHCF-BPR для повышения точности. В исследовательских целях перспективно включать в рассмотрение более сложные модели (DeepFM) и их модификации, поскольку на больших объемах данных или с добавлением контентных признаков они могут показать себя лучше.

Таким образом, реализованная рекомендательная система показала свою эффективность для поддержки пользователей геопортала ИДСТУ СО РАН, а проведенный анализ алгоритмов предоставляет базу для ее дальнейшего совершенствования.

Конфликт интересов

Авторы заявляют об отсутствии конфликта интересов.

Финансирование

Авторы заявляют об отсутствии внешнего финансирования.

Библиографическая ссылка

Климонов М.С. ПРИМЕНЕНИЕ МЕТОДОВ СОВМЕСТНОЙ ФИЛЬТРАЦИИ В РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЕ ГЕОПОРТАЛА // Современные наукоемкие технологии. 2026. № 1. С. 44-50;
URL: https://top-technologies.ru/ru/article/view?id=40647 (дата обращения: 03.07.2026).
DOI: https://doi.org/10.17513/snt.40647

Научный журнал
Современные наукоемкие технологии

ISSN 1812-7320

"Перечень" ВАК

ИФ РИНЦ = 1,279