Научный журнал
Современные наукоемкие технологии
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

Иерархическая структура извлечения знаний

Гинис Л.А
Процесс познания неотделим от человека. Человеческий разум сам по себе не приспособлен для восприятия больших массивов разнородной информации. Технологии интеллектуального анализа данных на сегодняшний день являются наиболее совершенным инструментом для решения сложных аналитических задач. Представим процесс интеллектуального анализа (познания, извлечения знаний) как иерархическую структуру (Месарович М. и др. «Теория иерархических многоуровневых систем».-М.: Мир, 1973).

Такая структура - это очевидно, набор подсистем (эшелонов). В настоящее время рассматривают три аспекта (три эшелона иерархии) данного процесса: психологический, лингвистический и гносеологический [«Базы знаний интеллектуальных систем»/Т.А. Гаврилова, В.Ф. Хорошевский.- СПб.: Питер, 2001. -384с]. Считается, что психологический эшелон (S1) является ведущим, так как именно он определяет успешность и эффективность взаимодействия аналитика с основным источником знаний - экспертом-профессионалом. Психологический эшелон выделяется еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработчиков системы, а в общественной коммуникации психология является доминантной. На данном уровне иерархии выделяют три слоя: Sl = {S11, S12, S13}  = {контактный, процедурный, когнитивный}. Лингвистичес-кий эшелон (S2) касается исследований языковых проблем, так как язык - это основное средство общения в процессе извлечения знаний. Здесь S2 = {S21, S22, S23} = {«общий код», понятийная структура, словарь пользователя}. Гносеоло-гический эшелон (S3) извлечения знаний объединяет методологические проблемы получения нового научного знания, поскольку при создании любой базы знаний эксперт часто впервые формулирует некоторые закономер-ности, до того момента составлявшие его личный опыт. На таком эшелоне S3 = {S31, S32, S33, S34} = {внутренняя согласованность, системн-ость, объективность, историзм}. Как видим, на каждом эшелоне можно последовательно выделить три слоя: выбор, обучение и самоорганизация, и затем проводить, вертикальный анализ. Совершенно однозначно, что на любом слое существует уровень описания (или абстрагирования), который называют стратой. Таким образом, мы имеем многоэшелонную многослойную стратифициро-ванную систему извлечения знаний. Кроме того, почти всегда можно выделить как минимум две страты: обработка информации (вычисления, программирование и т.п.) и формализация (выбор метода описания).

Где можно применить подобную систему. Социально-экономическая система является именно такой системой, где отличительной характеристикой является факт наличия больших массивов ретроспективной информации с разнообразными формами ее представления. Следовательно, процесс извлечения знаний является достаточно трудоемким. Формализуя представленную систему, имеем следующее. S1 = Лингвистический эшелон = {сбор ретроспективных данных по ряду характеристик, унификация форм представления, формирование исходного массива}. S2 = Анализ фактографической информации на основе многомерных методов статистики = {факторный анализ, кластерный анализ, построение когнитивной модели}. S3 = Гносеологический эшелон = {Определение методов исследования, разработка методики прогнозирования, исследование на модели}. Понимание системы возрастает при последовательном переходе от одной страты к другой: чем ниже мы опускаемся по иерархии, тем более детальным становится раскрытие системы, чем выше мы поднимаемся, тем яснее становится смысл и значение всей системы.


Библиографическая ссылка

Гинис Л.А Иерархическая структура извлечения знаний // Современные наукоемкие технологии. – 2006. – № 8. – С. 59-60;
URL: https://top-technologies.ru/ru/article/view?id=24798 (дата обращения: 28.03.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674