На сегодняшний день для интеграции информационных систем и ресурсов сети Интернет применяется широкий набор инструментов, включающий различные варианты обмена через файловые выгрузки, SOAP веб-сервисы, использование шин обмена данными, систем управления нормативно-справочной информацией, т.е. MDM-систем. Но представленные варианты являются лишь инструментами, не решающими проблему, конфликт, возникающий при интеграции, а именно: семантическую неоднородность данных, которую решают посредством описания предметной области, спецификаций структуры, поведения объектов, проверкой и согласованием предметной области.
Описывая предметные области, чаще всего прибегают к онтологиям.
Применение онтологий в процессе объединения программных продуктов позволяет повысить эффективность данного процесса.
Объединяют онтологии с целью выявления соответствия предметных областей друг другу. Интеграцию, слияние производят посредством инструментальных средств онтологического инжиниринга. Но какие средства лучше справляются с поиском соответствий и выявлением ошибок?
На сегодняшний день известно множество методов оценки качества программного обеспечения, поэтому задача выбора оптимального для оценки качества становится наиболее сложной.
Оценка качества программных систем работающих с онтологиями, позволяет оценить эффективность их использования, что является достаточно актуальной проблемой современного онтологического инжиниринга и интеграции.
Для оценки качества в исследовании выступали конфигурации, разработанные на основе платформы 1С: Предприятие 8, для использования в стенах института: ИС учета лицензионного программного обеспечения института, ИС материально-технического обеспечения института.
Таким образом, цель научной работы заключается в оценке качества программных систем при связывании объектных спецификаций по семантике онтологического уровня.
Для решения поставленной цели было необходимо решить следующие частные задачи:
- проанализировать данные о системах процесса интеграции онтологий;
- предложить методику оценки программных средств;
- сформировать набор номенклатуры показателей качества оцениваемых программных систем;
- провести эксперимент и анализ полученных результатов.
Инструментальные средства
На сегодняшний день накопилось много онтологий из разных сфер деятельности. Но, когда возникает вопрос их совместного использования, образуется задача, как объединить не соответствующие друг другу из разных направлений онтологии?
На помощь приходят инструменты объединения.
К таким инструментам относят инструменты отображения, выравнивания и объединения онтологий.
Отображение (mapping) – находит смысловые связи между подобными элементами из различных онтологий [1].
Выравнивание (alignment) – данный вид инструмента устанавливает вид соответствий (или связей) между предлагаемыми онтологиями, в последующем сохраняет используемые онтологии, а в будущем используют информацию друг друга [1].
Объединение (merging) – создает одну онтологию из двух исходных [1].
В работах [2, 3] отмечается, что «только на основе отображения онтологий решается задача интеграции онтологий», т.е. задача создания новой онтологии и ее частей из двух или нескольких исходных онтологий.
Таким образом, в контексте данной работы основным инструментом объединения стало отображение.
Инструментальными средствами, которые имеют дело с нахождением связей между онтологиями, являются PROMPT, Chimaera, OntoMerge, OntoMorph, OBSERVER, FCA-Merge, ONION.
Проведя проверку работоспособности предложенных средств и средств, описанных в работе [4, 5], выявляется тенденция устаревания, ввиду прекращения работ по поддержке Web-ресурса, обновлению баз онтологий, отключения сайта из-за неуплаты хостинга. Ресурсы, представленные в [4, 5], являются узкоспециализированными и не подходящими для проведения работ в данном исследовании.
Из всего предложенного списка действующими инструментами являются: Chimaera, OntoMerge и PROMPT.
Данные инструменты будут представлены к оценке экспертам.
На рисунке представлен фрагмент онтологии ИС учета лицензионного программного обеспечения института, разработанный в Protege, который в последующем будет использован для интеграции.
Методология
Существует много методов оценки качества, но известными стали три.
Метод, применяющий за базу «золотой стандарт», методы ручного-экспертного оценивания (где одним из популярных и применяемых такими корпорациями, как «Toyota», «General Motors», «Apple» и др., является «метод анализа иерархий»), метод косвенной оценки с использованием других приложений [6].
Онтология ИС учета лицензионного программного обеспечения института в PROMPT
Первый метод основан на разработке идеального прототипа онтологии по документам и данным организации, в последующем из которого удаляют части концептов, экземпляры, связи и запускают процессы конструирования онтологии. По завершению итоговую онтологию сравнивают с золотым стандартом. Данный метод применяется, но имеет коллизии субъективности и полноты онтологий, что может занизить оценку программы интегрирования.
Экспертное оценивание онтологий осуществляется путем применения списка критериев, к примеру: объемность онтологии, согласованность данных, полнота, точность структурирования и много других.
Применяя данный способ, с большим количеством участников-экспертов и точно сформулировав критерии, в большинстве случаев удается избежать вышеупомянутых проблем.
Одним из видов экспертного оценивания является метод анализа иерархий.
Метод Анализа Иерархий (далее по тексту МАИ) – математический инструмент системного подхода к решению проблем принятия решений. Суть МАИ – не наталкивать человека или программу, принимающие решение, на какой-то «правильный» путь, выбор, а дать ему возможность, общаясь путем диалога, сделать тот выбор, который лучше всего подходил бы под его восприятие сущности задачи и проблемы, и способам ее решения.
К важному достоинству данного метода причисляют его универсальность, так как он применяется в любых задачах, например: предугадывание сценария развития событий, планирование расхода ресурсов, оценивание клиентов и персонала, решение кадровых проблем и др.
Косвенный метод оценки использует сторонние приложения, перенося задачи оценки в ранее исследованные области, например систему поиска в интернете. Судить о качестве онтологии можно, используя построенную онтологию, путем оценивания полноты и точности поиска. Применяя данный метод, не требуется каких-либо затрат, но нужно знать, точность оценки минимальна, из-за влияния большого количества обстоятельств. Поэтому оценивать онтологии таким методом не рекомендуется.
Из представленного описания методов оценки качества программ связывающих онтологии, видны недостатки в двух методах, поэтому для оценивания программ связывания онтологий был выбран метод экспертного оценивания.
Критерии оценивания
Интеграция данных может обеспечиваться на физическом, логическом и семантическом уровне.
Первые два уровня за последнее время достаточно проработаны, в отличие от семантического уровня. Он позволяет рассмотреть семантические свойства онтологии предметной области и создать единую систему представления данных.
Но при использовании данного подхода возникает проблема разности онтологий и источников данных.
Данные противоречия рождают проблемы, препятствующие интеграции.
К таким проблемам относят конфликты, выражающиеся в гетерогенности метаданных и данных.
Конфликты, возникающие в гетерогенных системах, выражаются в несоответствии понятий, используемых в одной и другой БД, и представляются в виде конфликтов наименований, семантики и структур [7].
К ним относят: конфликт атрибут – атрибут; конфликт атрибут – сущность; конфликт сущность – связь и т.д.
В исследовании для определения качества программных систем выбраны наиболее часто встречающиеся конфликты при связывании онтологий: омонимии, синонимии, атрибут – атрибут, атрибут – сущность, сущность – связь, конфликт типов и масок данных.
Данные критерии стали основными в анкете экспертов.
Оценка
В качестве способа оценки пакетов был выбран метод экспертного оценивания [8].
Основной задачей для группы экспертов состоящей из 8 человек, было проведение интеграции разработанных онтологий в представленных пакетах и их оценка по критериям, в качестве которых выступали конфликты, т.е. оценка того, на сколько программа справляется с выявлением и устранением конфликтов.
Подбор экспертов осуществлялся по методу Шара (суть данного метода заключается в привлечении одного эксперта, который в последующем приведет за собой таких же экспертов, как он).
Для проведения оценки был подготовлен зал с рабочими местами для экспертов. Зал разделен на восемь ячеек, перегороженных между собой.
Таким образом, каждый эксперт не мог видеть эксперта по соседству, что сократило давление авторитетных экспертов.
Для определения весовых значений критериев, перед оценкой, экспертам были представлены выбранные критерии для установки весовых значений.
В результате установки значений каждым экспертом должно получиться среднее значение. Расчет средних значений был проведен по формуле
(1)
где Exi – коэффициент, представленный экспертом;
n – номер эксперта.
Таким образом, представленные на обозрение критерии были оценены экспертами и представлены в табл. 1.
В ходе исследования перед проведением процедуры было принято, что анкетирование будет анонимным с целью получения большего количества правдивых ответов.
Значения шкалы для оценки выбраны в диапазоне от 1 до 10.
При оценке эксперты руководствовались следующим правилом:
– «плохо» от 1 до 4;
– «хорошо» от 5 до 8;
– «отлично» от 9 до 10.
Таблица 1
Результаты оценки критериев экспертами
Конфликт (критерий) |
Коэффициент |
Омонимия |
0,129 |
Синонимия |
0,253 |
Атрибут – атрибут |
0,071 |
Атрибут – сущность |
0,097 |
Сущность – связь |
0,152 |
Конфликт типов и масок данных |
0,298 |
После оценивания суммарные значения критериев рассчитывались по формуле
(2)
где Kr – критерий,
Kf – коэффициент,
n – количество экспертов.
Результаты расчётов представлены в табл. 2.
Таблица 2
Суммарные значения критериев
Критерий |
Chimaera |
OntoMerge |
PROMPT |
Омонимия |
0,61275 |
0,774 |
0,93525 |
Синонимия |
1,32825 |
1,423125 |
1,771 |
Атрибут – атрибут |
0,417125 |
0,37275 |
0,58575 |
Атрибут – сущность |
0,55775 |
0,424375 |
0,65475 |
Сущность – связь |
0,798 |
0,703 |
0,931 |
Конфликт типов и масок данных |
1,5645 |
1,788 |
1,82525 |
Итого: |
5,278 |
5,485 |
6,703 |
После подсчетов в итоге, по оценке экспертов, инструментальным средством для интеграции онтологий, которое справилось лучше других с конфликтами, стал плагин Protege – PROMPT.
Важным выводом стало то, что существует прямая зависимость того, как будут связаны слоты каждого класса связываемых онтологий от качества и специализированности используемых пакетов для интеграции.
Данное исследование показывает, комбинации каких методов и инструментальных средств позволяют достичь сокращения большой итеративности, сроков и повышения качества объединяемых онтологий при интеграции систем с разнородными данными, различными степенями качества разработки.
Заключение
Таким образом, проделанная работа показывает, что процесс интеграции информационных систем в достаточной мере может занижать качество программного продукта. Это показывает целый ряд выявленных конфликтов при сопоставлении данных, которые влияют на показатели устойчивости функционирования и работоспособности программных систем. Доказано, что на уровне сопоставления онтологических моделей возрастает качество программных систем.