Быстрое развитие информационных и коммуникационных технологий заставляет правительства, организации или институты переносить свои ресурсы на цифровую платформу и оцифровывать данные, содержащиеся в обычных документах. Эффект оцифровки – это цифровое преобразование, из-за которого объем данных увеличивается. Широко распространенная цифровая трансформация заставляет заинтересованные стороны изменять свою стратегию и бизнес-модель, чтобы поддерживать конкурентоспособность.
В последнее время система виртуального музея становится популярной, многие музейные учреждения создают свою политику цифрового сохранения музейных данных, разрабатывают онлайн-сайты, демонстрируют виртуальные коллекции и создают выставки в различных СМИ, создавая тем самым новую форму представления и изучения музейной информации [1, 2].
Вместе с этим феномен цифровой трансформации предоставляет гораздо больше доступной информации, чем прежде, что порождает новые проблемы. Одна из них – помочь обычным посетителям виртуального музея с определением, где находится лучшая информация, которая им действительно необходима [3]. Другая – развитие музейных онлайн-магазинов, которые могут стать для бизнеса новым рынком продаж продуктов, связанных с музейным контекстом [4]. В данной работе приводится описание методов проектирования архитектуры автоматизированной системы управления тематическими виртуальными музеями (АСУ ТВМ), системы рекомендаций ТВМ, инструмента для пользовательской оценки, а также ставятся эксперименты по оцениванию респондентами (участниками) качества работы АСУ ТВМ.
Архитектура микросервисов АСУ ТВМ
Многие организации и компании с целью сокращения эксплуатационных расходов создают собственные центры обработки данных. Однако, по мере развития предприятия и роста объемов информации, ресурсы центров достигают заложенного в них предела, и компаниям делается трудно обойтись без покупки дополнительных ресурсов. В то же время облачные вычисления предлагают масштабируемые модели услуг по требованию, такие как «Инфраструктура как услуга» (IaaS), «Платформа как услуга» (PaaS) и «Программное обеспечение как услуга» (SaaS), которые реализуют развертывание ресурсов как общедоступного, частного или гибридного облака, в зависимости от требований клиента или бизнеса.
Национальный институт стандартов и технологий США (NIST) определил облачные вычисления как модель для обеспечения удобного сетевого доступа по требованию к общему пулу конфигурируемых вычислительных ресурсов, включая сети, серверы, хранилища, приложения и сервисы, которые могут быть быстро предоставлены с минимальными усилиями по управлению или взаимодействию с поставщиками услуг [5]. Облачные вычисления имеют много преимуществ перед традиционными, например стоимость, скорость, масштабируемость, производительность, эффективность и надежность.
Облачные провайдеры, такие как Google и Amazon, вывели облачные вычисления на первый план общественного сознания, они предлагают свои услуги в таких направлениях, как вычисление, хранение и доставка контента, базы данных, создание сетей, инструменты для разработчиков, управление безопасностью, аналитика, большие данные, машинное обучение и другие [6].
Раньше при разработке программного обеспечения в основном использовали сервис-ориентированную архитектуру (SOA), которая является результатом эволюции клиент-серверной модели. SOA предоставляет услугу по протоколу связи компонентов через сеть и опирается на простой тип Remote Procedure Calls. Часто используется, например, Simple Object Access Protocol (SOAP). Клиент в основном, используя стандартный язык общения (например, XML), взаимодействует посредством обмена сообщениями со связующим программным обеспечением, которое перенаправляет эти сообщения сервисам с различных типов [7]. Сервисы SOAP широко используют тяжеловесное промежуточное программное обеспечение для организации сервисов, таких как Сервисная шина предприятия (ESB) [8].
В [9] были описаны разработанные индекс и обслуживающий его небольшой сервис, названные «микросервисами». Идея микросервисов в настоящее время завоевала большую популярность по сравнению с традиционной идеей монолитной архитектуры. Большинство исследователей выбрали микросервисы для получения масштабируемости, быстрого реагирования, быстрого развертывания программного обеспечения, функционального разделения устойчивости, снижения затрат на ресурсы и т.п. [7].
Децентрализуя архитектуру приложения, разработчики программного обеспечения могут писать больше логики в микросервисах, а связь между сервисами упрощается с использованием протокола REST [8]. Основное различие между микросервисами и сервисами SOAP заключается в использовании промежуточного программного обеспечения для бизнес-процессов.
В полной реализации АСУ ТВМ применяется стиль архитектуры микросервисов, которая опирается на облачные вычисления, признаваемый как самый современный. Схема архитектуры микросервисов АСУ ТВМ показана на рис. 1.
Рис. 1. Архитектура системы АСУ TVM
Службы сервера фронтенд и бекенд АСУ ТВМ, показанные на рис. 1, полностью разработаны на языке программирования Go, где сервисные компоненты использовали сервисы облачного хранилища, которые могут легко подключаться, отключаться и автомасштабироваться, когда требуется пространство для хранения. Служба сервера фронт-серверов АСУ ТВМ отвечает за обработку запросов и дает ответы пользователям, служба взаимодействует с ними в общедоступной сети, без ограничений. С учетом проблемы безопасности, сервисы сервера бекенд АСУ ТВМ установлены только в частной сети [10].
Бекенд-сервисы АСУ ТВМ состоят из небольших микросервисов, которые объединяются и интегрируются со службами тематического моделирования музейного контента, индексов, доступа к данным, сервера баз данных и облачного хранения. Доступ к функциональным возможностям микросервисов вышеуказанных служб обработки информации выполняется посредством программного интерфейса API, который предоставляет АСУ ТВМ. Поскольку наша комплексная система была разделена на микросервисы, метрические службы мониторинга и записи информации о поведении пользователей по запросам (количество кликов по результатам, выбор тематики, количество запросов и др.) были интегрированы в систему как отдельный микросервис для возможности быстрого обмена с другими компонентами системы.
Через интерфейс фронтенда пользователь может напрямую вводить ключевые слова для поиска информации в коллекциях АСУ ТВМ, это действие будет обрабатываться микросервисами независимых индексов, которые объединяются с функциональными модулями, такими как TF-IDF и VSM на бекенд-сервере. Микросервисы индексов обрабатывают любой запрос пользователя, а затем сохраняют верхние N элементов списка наиболее подходящих коллекций документов в кэш (временно) и возвращают в качестве ответа в соответствующем формате JSON.
Архитектура АСУ ТВМ распределенная и дает возможность для обработки многих запросов пользователя, используя автоматическую масштабируемую инфраструктуру с помощью сетевых и прикладных программ балансировки нагрузки.
Система рекомендации ТВМ
За процедуру поиска информации отвечает рекомендательная система. Можно условно выделить три метода рекомендации: контентно-ориентированные (CB) (рекомендуют статьи или товары на основе похожести ранее выбранных конкретным пользователем объектов), коллаборативная фильтрация (CF) (помогают людям принимать решение на основе мнений других людей, которые имеют схожие интересы) и гибридные (комбинация предыдущих методов) [11, 12].
Поскольку АСУ ТВМ фокусируется на выдаче тематического контента коллекций документов в виртуальном музее, то для предоставления конкретному пользователю релевантных для него тематических данных АСУ ТВМ использует фильтрацию СВ. Преимуществом CB является независимость от данных пользователя, рекомендация предоставляется только на основе содержимого документа [13]. Для обработки информации о музейной коллекции и определения конкретных тем ТВМ выполняет классификацию каждого документа в базе данных и индексе, исходя из предположения, что коллекция документов принадлежит только одной теме.
Для предсказания интересов пользователя был создан профиль пользователя под названием term based profile [14], в котором содержатся термины документов как признак для отслеживания и записи скрытого пути просмотра пользователем документов в коллекции. Данный признак используется для решения проблемы первого запуска (Cold start) при рекомендации на основе CB фильтрации, когда информация в профиле пользователя отсутствует. В этом случае рекомендательная система предоставляет несколько тем, которые были выявлены службами ТВМ. В случае первого визита и регистрации пользователя АСУ ТВМ предоставляет ему перечень сгенерированных тем, которые его могут заинтересовать. Система рекомендаций разработана по схеме на рис. 2.
Рис. 2. Страница рекомендаций АСУ ТВМ
На рис. 2 показана страница рекомендаций АСУ ТВМ при самом первом входе пользователя в систему. На странице рекомендаций 5 категорий, рекомендующих коллекции:
a) «потому что вы заинтересовались темой» (рекомендованы темы, посещенные большинством пользователей);
б) «выбор лучших коллекций для вас» (рекомендованы коллекции, основанные на списке лучших коллекций, посещенных большинством пользователей);
в) «трендинг коллекций» (рекомендованы топ лучших коллекций пользователями ТВМ);
г) «трендинг тем» (рекомендованы топ лучших тем пользователями ТВМ);
д) «популярные коллекции для вас» (рекомендованы топ лучших коллекций для конкретного пользователя).
Страница с подробной информацией о коллекциях ТВМ (TVM detail collection page), как показано на рис. 2, содержит две категории, которые рекомендуют информацию:
a) похожие коллекции (рекомендованы текущие похожие локальные тематические коллекции или наиболее схожие с текущей тематикой посещенной коллекции);
б) тема, которой вы могли бы заинтересоваться (предлагаются подходящие темы коллекции, основанные на симметричной мере расхождения Дженсена – Шеннона [15–17]).
Оценка АСУ ТВМ
Для оценивания общей работы АСУ ТВМ была проведена внутренняя оценка и оценка с точки зрения пользователя. Пользовательская оценка АСУ ТВМ производилась путем предоставления вопросников для определения пользовательского опыта. Восприятие пользователя становится ключевым показателем того, насколько эффективна интеллектуальная АСУ ТВМ. Пользовательская оценка позволяет понять, как и почему работают или не работают все разработанные сервисы АСУ ТВМ. Данная оценка может быть использована для улучшения и развития ТВМ в будущем.
В качестве пользовательской оценки используется унифицированный фреймворк под названием ResQue, предложенный в работе [18]. ResQue фреймворк основан на использовании принципов моделей оценки удобства использования (таких как модель принятия решений (TAM), оценки практичности программного обеспечения (SUMI)) и психометрических методов [18]. На основе фреймворка ResQue была составлена онлайн-анкета ТВМ, которая состоит из четырех частей:
1. Воспринимаемые качества системы (Perceived Quality). К нему относятся такие качественные рекомендации, как воспринимаемая точность, новизна, привлекательность, разнообразие, контекстная совместимость, адекватность интерфейса, адекватность взаимодействия, достаточность и объяснимость информации.
2. Убежденность пользователей (User beliefs). Параметры для измерения эффективности АСУ ТВМ, такие как простота использования, восприятие полезности, контроля и прозрачности.
3. Отношение пользователя (User Attitudes). Относится к удовлетворенности и доверию пользователей, основанным на всех качествах системы и предлагаемых услугах.
4. Поведенческие намерения (Behavioral Intention). Сосредоточены на том, что пользователь будет делать после того, как использовал систему, например, намерение продолжить работу с системой; рекомендовать своим родственникам или другу; уделять больше внимания предметам/темам, предлагаемым АСУ ТВМ.
Четыре части в онлайн-анкетах ТВМ разделены на восемь показателей качества: качество системы, адекватность взаимодействия, адекватность интерфейса, воспринимаемая легкость использования, воспринимая полезность, контроль и прозрачность, отношение пользователей и поведенческие намерения. Было сформулировано в общей сложности 33 вопроса, которые использовались для проверки АСУ ТВМ в целом с точки зрения пользователя.
Эксперименты
Был поставлен эксперимент по оценке функциональности АСУ ТВМ. Была использована облачная инфраструктура Google, расположенная в азиатском регионе Юго-Восточной Азии 1-b, с аппаратными характеристиками были процессоры Intel Xeon E5 v4 (Broadwell) 2,2 ГГц, память 3,7Gb и дисковый накопитель 20Gb. Документы использовались в этом эксперименте на основе корпуса ТВМ, который содержал информацию о 23 485 музейных экспонатах и 20 951 термине (минимум 2 слова, содержащиеся в каждом документе в таблице).
С 5 по 15 марта 2018 г. в Региональном открытом учебном центре Министерства образования стран Юго-Восточной Азии (страна Индонезия) подразделении по обеспечению информационных технологий и публичной онлайн-оценке была проведена оценка качества разработанной интеллектуальной АСУ ТВМ. Этот эксперимент прошел полную онлайн-оценку через веб-сайт ТВМ с 111 участниками, зарегистрированными в системе.
В первой части эксперимента проводилась внутренняя оценка АСУ ТВМ, в рамках которой были созданы 100 тем, используемые в качестве меток кластеров документов. В целях проведения онлайн-эксперимента участникам ставились такие задачи, как изучение тематических музейных коллекций (от 1 до 100 тем) с выбором нескольких интересных, изучение рекомендованных коллекций, поиск информации о коллекции по любым ключевым словам на рекомендованных страницах коллекций.
Во внутренней оценке АСУ ТВМ была подсчитана информация о времени обработки запросов пользователей системой путем записи и вычисления задержки при подключении внешних интерфейсов ТВМ и бекенд-сервиса, как показано на рис. 3.
а) б)
в) г)
Рис. 3. Задержка от фронтенд к бекенд сервера
АСУ ТВМ через внешний сервер выполняет запросы от клиентов по исследованию тематики музейного экспоната и рекомендует тематическую коллекцию. На рис. 3, a, показано, что среднее время ожидания запросов, когда пользователи получают доступ к исследованию рекомендованных коллекций, составляет 10 мс. На рис. 3, б, показано, что среднее время ожидания запросов, когда пользователи получают доступ к темам поиска, составляет 4 мс. На рис. 3, в, показано, что среднее время ожидания запросов, когда пользователи получают доступ к деталям коллекции, составляет 6 мс. На рис. 3, г, показано среднее время ожидания запросов, когда пользователи просматривают информацию на странице поиска, составляет 3 мс. Среднее время обработки запросов по четырем основным компонентам АСУ ТВМ составило 7 мс. Этот эксперимент показал, что интеллектуальная АСУ ТВМ соответствует критериям времени отклика или задержки в микросервисах [19].
Во второй части эксперимента проводилась пользовательская оценка системы ТВМ. Чтобы оценить АСУ ТВМ с точки зрения пользователя, использовался явный метод, который напрямую спрашивает пользователей об их реакциях на систему [20]. В процессе оценивания системы для каждого пользователя была подготовлена страница вопросников ТВМ и форма анкеты для заполнения. Шкала Ликерта использовалась для измерения респондента в вопросах ТВМ, которая объединила схожие вопросы в единую оценку. Формат шкалы Ликерта задается пятью уровнями отношения пользователя к системе: 1) «Полностью не согласен», 2) «Не согласен», 3) «Где-то посередине», 4) «Согласен» и 5) «Полностью согласен». Шкала Ликерта для единственного вопроса – это расчет частоты ответа, в то время как групповые вопросы используют среднее значение частоты ответа при обработке восьми сегментов или четырех частей вопросников ТВМ.
На рис. 4 показаны результаты оценок по следующим 8 качественным показателям: (a) качества системы, (b) адекватности взаимодействия, (c) адекватности интерфейса, (d) воспринимаемой легкости использования, (e) воспринимаемой полезности, (f) контроля и прозрачности, (g) отношения пользователей и (h) поведенческих намерений. В целом большая часть опрошенных респондентов 51,61 % «Согласны» с высоким качеством выдаваемых результатов АСУ ТВМ, 36,23 % респондентов – «Полностью согласны». Только 8,43 % респондентов заявили «Где-то посередине», 3,26 % «Не согласны» и 0,47 % «Полностью не согласны».
Рис. 4. Процентная оценка вопросников ТВМ по восьми показателям качества
Рис. 5. Процентная оценка вопросников ТВМ по четырем группам
Общая процентная оценка АСУ ТВМ по четырем категориям онлайн-анкеты ТВМ представлена на рис. 5.
На рис. 5 показаны суммарные результаты по четырем категориям параметров: поведенческие намерения, отношение пользователей, убежденность пользователей и воспринимаемое качество. Наибольшая часть опрошенных респондентов (49,39 %) выбрали «Согласны», 38,75 % «Полностью согласны». Только 8,47 % респондентов заявили «Где-то посередине», 2,89 % «Не согласны» и 0,49 % «Полностью не согласны». Была проверена достоверность вопросников ТВМ по показателю альфа Кронбаха [21], значение которого составило 0,95, что указывает на высокую внутреннюю согласованность результатов анкетирования АСУ ТВМ.
Заключение
В данной работе были описаны архитектура АСУ ТВМ, система рекомендаций ТВМ, инструмент для пользовательской оценки, а также проведена оценка качества работы АСУ ТВМ в процессе ее внедрения в Региональный открытый учебный центр Министерства образования стран Юго-Восточной Азии (страна Индонезия).
Результаты оценки системы показали, что среднее время отклика запросов по четырем основным компонентам АСУ ТВМ составляло 7 мс, разработанная интеллектуальная система АСУ ТВМ соответствует критериям времени отклика или задержки в микросервисах.
Большая часть опрошенных респондентов по восьми основным параметрам качества системы ТВМ (51,61 %) согласны с высоким качеством системы, 36,23 % респондентов полностью согласны. Суммарная оценка по четырем категориям параметров показала 49,39 % согласных и 38,75 % полностью согласных пользователей, что в целом указывает на высокий уровень согласованности оценки со стороны респондентов разработанной автором АСУ ТВМ.