Обеспечение населения Самарской области питьевой водой - одна из приоритетных проблем, решение которой необходимо для сохранения здоровья и повышения уровня жизни населения. Необходимость ее решения обусловлена изношенностью оборудования водопроводных сооружений и сетей, повсеместным ухудшением состояния источников воды, техническими трудностями получения питьевой воды, соответствующей санитарно-гигиеническим нормативам. Существует также проблема крайне низкой водообеспеченности отдельных районов области и снижение уровня водоносных горизонтов в связи с засушливыми периодами.
Самарская область одной из первых в российской Федерации приняла и выполняет областную целевую программы «Обеспечение населения Самарской области питьевой водой» на 2005-2010 годы» [4].
Цели и задачи данной программы: обеспечение населения области питьевой водой нормативного качества и в достаточном количестве; улучшение на этой основе состояния здоровья и качества жизни населения; восстановление и рациональное использование источников питьевого водоснабжения.
В рамках выполнения программы авторами был предложен концептуальный подход и разработаны методики использования информационных технологий для управления жизненным циклом системы водоснабжения на этапах проектирования, строительства и эксплуатации [5].
Материал и методы исследования
На начальных стадиях проектирования задача анализа и выбора облика технического объекта из имеющихся вариантов в основном соответствует постановке задачи принятия решений. Однако традиционная постановка не учитывает поисковый характер проектирования, оставляя без внимания его творческие аспекты. Более адекватной модель принятия решения будет в том случае, если схему многокритериального выбора предпочтительного технического предложения дополнить средствами генерации возможных проектных решений, их предварительной фильтрации, оценки их технологического уровня.
Решение этих задач, связано с привлечением средств обработки знаний, логического вывода и расчетно-логических процедур. Наличие четырех перечисленных элементов сочетается в интеллектуальных системах поддержки принятия решений (ИСППР).
Указанные системы относятся к классу интегрированных интеллектуальных систем, сочетающих строгие математические методы и модели поиска решения с нестрогими, эвристическими моделями и методами, базирующимися на знаниях специалистов, моделях человеческих рассуждений и накопленном опыте [2].
Ядром ИСППр [6] является экспертная система (ЭС) куда включены два набора баз: «Поверхностные воды» и «Подземные воды» в соответствии с классификацией НИИ ВОДГЕО [3].
Экспертные системы аккумулируют профессиональные знания опытных квалифицированных экспертов и предназначены для решения практических задач, возникающих у специалиста, работающего в слабоструктурированной и трудно формализуемой предметной области [1].
Основу любой экспертной системы составляет база знаний(БЗ). В ней накапливаются эмпирические факты из исследуемой предметной области: фактические данные, примеры экспертных заключений, элементарные высказывания с некоторой оценкой и т.п. Также в нее заносятся сведения, выражающие закономерности структуры множества эмпирических фактов и способы решения возникающих в этой области задач. Кроме того, в БЗ помещается «информация об их важности, а также сведения о том, каким образом эти связи и закономерности могут быть использованы». Закономерности в БЗ представляются в виде различных математических моделей. От качества представления данных и знаний зависит эффективность принимаемых решений экспертной системой, которые строятся в логическом блоке, или решателе.
Базовым понятием в ЭС является «знание», при решении задачи получения знаний для экспертных систем выделяют три стратегии: приобретение, извлечение и формирование знаний [1].
Приобретение знаний осуществляется посредством автоматизированного диалога между экспертом и специальной программой. Таким образом удается получить фрагменты знаний в соответствии со структурами, заложенными разработчиками системы. Существует ряд недостатков в данной стратегии, таких как: привязанность к предметной области, неполнота приобретаемых знаний, упрощение структуры знаний.
Извлечение знаний происходит без привлечения вычислительной техники путем непосредственного контакта инженера по знаниям и источником знаний (экспертом, специальной литературой и др.). Инженеру по знаниям необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решений. Это длительная и трудоемкая процедура.
Формирование знаний осуществляется непосредственно в самой экспертной системе, которая «самостоятельно» формирует необходимые знания или получает «новое» знание, явно не задаваемое экспертом. Другими словами, формирование знаний - это задача обработки баз данных с целью перехода к базам знаний.
Итак, разработка экспертной системы («ядро» интеллектуальной системы поддержки принятия решений для технологических схем очистки природных вод) включает в себя следующие основные этапы и подэтапы:
1. База знаний «Поверхностные воды».
1.1 Создание сценария процесса логического вывода или база фактов на этапе проектирования.
1.2 Заполнение базы правил в соответствие с синтаксисом правил продукционной модели.
1.3 Формирование графа логического вывода.
2. База знаний «Поверхностные воды».
2.1 Создание сценария процесса логического вывода или база фактов на этапе проектирования.
2.2 Заполнение базы правил в соответствие с синтаксисом правил продукционной модели.
2.3 Формирование графа логического вывода.
Сценарий процесса логического вывода (список фактов ЭС).
Наиболее полной формой представления процесса логического вывода является сценарий. Он состоит из последовательности фактов базы знаний - элементарных состояний процесса логического вывода (СПлВ). Функциональным назначением СПлВ является описание всех возможных данных, которые можно получить из анализа качества воды в соответствии с классификатором НИИ ВОДГЕО [3] и установка взаимосвязей между этими данными. СПЛВ - это таблица, каждая строка которой заполняется информацией о факте. Факт имеет следующую структуру:
<Факт>:= <Идентификатор> <Описание> <Отношения между фактами>
В начале формирования процесса логического вывода строится сценарий процесса логического вывода. СПлВ создается с использованием фактов. Процесс создания факта основывается на следующих этапах:
- а) создание идентификатора факта;
- б) формирование описания факта;
- в) создание списка информационных элементов, в частности идентификаторов последующих фактов и списков идентификаторов правил.
Создание идентификатора факта. любой идентификатор факта имеет следующий формат: <Прописная заглавная латинская буква> [<число>]. число ноль не используется для формирования идентификатора факта.
Формирование описания факта осуществляется пользователем и создается в соответствии со смысловой нагрузкой факта. Описание факта используется подсистемой объяснений экспертной системы и участвует в формировании объяснения по тому, как было найдено то или иное решение.
При создании списка <Отношения между фактами> определяются все возможные переходы к фактам, которые могут быть установлены, как следствие из факта, которому принадлежит данный информационный элемент. Имеет следующую структуру:
< Отношения между фактами >: =:= <Имя> <Идентификатор> <Список идентификаторов правил>
- а) имя - описание факта, который может быть установлен, как следствие из факта, которому принадлежит данный информационный элемент;
- б) идентификатор факта (Fnext), который может быть установлен, как следствие из факта, которому принадлежит данное имя;
- в) список идентификаторов правил показывает, в антецеденты каких правил входит факт, которому принадлежит данный информационный элемент, в консеквентах которых находится факт Fnext. Идентификаторы правил являются числами и их нумерация начинается с единицы.
Список <Отношения между фактами > может не полным, если факт является конечным или изолированным.
Список правил базы знаний ЭС.
База правил представляет собой упорядоченное множество правил, имеющих следующий формат:
<правило>: =<идентификатор> <Значение>,
где идентификатор - идентификатор правила, значение - само правило, то есть правило, записанное в соответствии с синтаксисом правил продукционной модели представления знаний.
База правил для подсистемы «Поверхностные воды».
В соответствии с классификатором НИИ ВОДгЕО [3] правила описывающие подсистему «Поверхностные воды» оделяться на четыре группы:
- Правила описывающие классы поверхностных водоисточников хозяйственнопитьевого водоснабжения.
- Правила описывающие подклассы поверхностных водоисточников по характеру их антропогенного загрязнения.
- Правила описывающие классификацию примесей по их фазо-дисперсному состоянию.
- Правила описывающие классификацию основных технологий водоочистки.
- Правила описывающие классификацию технологий водоочистки дополнительно к основным с учетом антропогенных загрязнений.
База правил для подсистемы «Подземные воды».
В соответствии с классификатором НИИ ВОДгЕО [3] правила описывающие подсистему «Поверхностные воды» оделяться на четыре группы:
- Правила описывающие классы поверхностных водоисточников хозяйственнопитьевого водоснабжения.
- Правила описывающие технологические схемы очистки подземных вод от природных загрязнений по классам для питьевого водоснабжения.
- Правила описывающие технологии очистки подземных вод по компонентам антропогенных загрязнений.
- Правила описывающие технологические способы и методы очистки подземных вод от растворенных газов.
Построение графа логического вывода. Сформируем граф логического вывода для разрабатываемой экспертной системы.
В качестве модели представления знаний в экспертной системе используется продукционная модель. Вершины графа - факты базы знаний, дуги характеризуют механизм рассуждения экспертной системы, то есть правила базы знаний. Правило «ЕСлИ А, ТО В» отражается в графе дугой, ведущей из вершины А в вершину В (в списке информационных элементов факта А присутствует факт В). Каждой дуге соответствует множество идентификаторов правил, в части «ЕСлИ» которых находится вершинафакт из которого выходит дуга, а в части «ТО» - вершина-факт в который эта дуга входит.
Каждая вершина может иметь несколько дуг, которые входят в нее из других вершин, и несколько дуг, которые выходят из нее в другие вершины. Механизм логического вывода происходит от вершины к вершине. После установления фактов начинается просмотр дуг, которые ведут из установленных вершин-фактов, а также просмотр идентификаторов правил, связанных с данными дугами. Если правило, соответствующее идентификатору правила дуги, содержит в части «ЕСлИ» другие факты, то выполняются операции с рассматриваемым фактом, согласно с синтаксисом соответствующего правила. Если результат этих операций будет иметь логическое значение true, то факт, стоящий в части «ТО» правила, считается установленным и добавляется в базу данных. Далее становится возможным рассматривать уже соответствующую вершину и дуги, выходящие из нее. Если правило, соответствующее идентификатору правила дуги, не содержит в части «ЕСлИ» другие факты, то факт, стоящий в части «ТО» этого правила, считается установленным.
Дуги подразделяются на:
- дуги с единственным идентификатором правила, соответствующего дуге;
- дуги с двумя и боле идентификаторами правил.
Полученный граф логического вывода представляет собой ориентированный граф.
В классическом поиске целевой вершины (конец рассуждений экспертной системы) используется прямой механизм логического вывода, т.е. должна существовать одна целевая вершина, по достижении которой рассуждения должны прекратиться. Однако, в нашем случае, может и не быть одной целевой вершины, так как целей может быть несколько. При работе механизма логического вывода может быть достигнута одна или несколько целей или не достигнуто ни одной (из-за нехватки информации для механизма логического вывода, например, по причине «скудности» входных данных). Поэтому, если хотя бы одно правило базы знаний сработало (состоялся хотя бы один переход в графе), то механизм логического вывода не прекращается. В противном случае механизм рассуждений прекращает свою работу и считается достигнутой целевая вершина поиска. Если вершина А уже размечена, как установленная, и вершина В, в которую входит дуга из А, также размечена, как установленная, то есть сработало, например, правило «ЕСЛИ А, ТО В», то это правило должно сработать и в следующий раз, что может привести к зацикливанию работы механизма логического вывода. Для предотвращения таких ситуаций используется следующий алгоритм: если рассматривается вершина А, размеченная, как установленная, то прежде, чем выполнить правило, в антецеденте которого находится вершина А, анализируются дуги, выходящие из вершины А и если вершина В, в которую входит данная дуга, является также размеченной, как установленная, то правила, соответствующие данной дуге и приводящие к установлению факта В, не считаются сработавшими.
Формирование знаний это процесс который представляет собой преобразование информации, полученной в виде фактов и правил, в форму приемлемую для машинной обработки. Выбор рационального способа представления знаний о предметной области является центральной проблемой построения любой интеллектуальной системы .
Для этого на основе графа логического вывода опишем формально-логическую модель представления знаний [7]. Пусть существует граф, состоящий из множества фактов Mg и множества элементов управления фактами Mq. Множества Mg и Mq образуют ориентированный граф логического вывода, причем вершинами графа являются элементы множества Mg, а дугами - элементы множества Mq. Дуга графа логического вывода - qi = (gout, gin) - бинарное отношение связанности, обозначаемое → ; gout → gin - дуга qi ведет из факта или вершины gout, называемой выходом дуги qi, к факту или вершине gin, называемой входом дуги qi. Тогда алгебраическая система представления графа логического вывода состоит из множества вершин или фактов Мω множества отношений или дуг Rω над этими вершинами:
Ω = <Mω, Sω, Rω>
где Мω = Gмножество вершин графа Ω. Sω - множество операций на множестве элементов графа, Rω - множество отношений или дуг графа логического вывода.
Следовательно, смежными вершинами графа Ω по отношению к одной вершине называются вершины gi, и gj, если дуги входящие в них, выходят из одной и той же вершины и только из нее.
Смежными вершинами графа Ω по отношению ко множеству вершин (МΨ) называются вершины gi, и gj, если эти вершины являются одновременно смежными, по отношению к каждой вершине из множества МΨ дуги, ведущие к вершинам gi, и gj из вершин множества MΨ являются α-дугами.
Вершины g1 и g2 эквивалентны по спискам информационных элементов, если дуги, выходящие из них, входят в одни и те же вершины, и дуги, выходящие из вершин g1 и g2 и входящие в какую-либо вершину g, имеют идентичные идентификаторы правил.
Степенью входа вершины gi(stin(gi)) называется количество вершин, которые напрямую связаны дугами с gi.
Степенью выхода вершины gi(stout(gi)) называется количество вершин, в которые входят дуги, выходящие из gi. Начальные вершины графа, имеют степень входа stin(gi) = 0.
Путь или трасса графа - последовательность дуг (q1, q2, ..., qn) вида qi = (gi, qi+1), i = 1, 2, ..., n. число дуг, составляющих путь, называется длиной пути или длиной трассы.
Трасса называется сложной, если в ней повторяется хотя бы одна вершина, и простой - в противном случае. Трасса, у которой начальная и конечная вершины совпадают, называется циклом.
Вершина g1 связана с вершиной g2 отношением прямого вхождения, если существует дуга, выходящая из вершины g1 и напрямую входящая в вершину g2 и не существует дуги, выходящей из вершины g2 и напрямую входящей в вершину g1.
Вершины g1 связана с вершиной g2 отношением косвенного вхождения, если существует путь с длиной, большей единицы, ведущий из вершины g1 в вершину g2 и не существует пути, ведущего из вершины g2 в вершину g1.
Ветвь вершины gi - множество вершин, имеющих трассы из g1.
Дуги q1 и q2 называются эквивалентными по идентификаторам правил, если идентичны идентификаторы правил, соответствующие дугам q1 и q2.
Дуги q1 и q2 называются эквивалентными по антецедентам, если они имеют равное количество идентификаторов правил, соответствующих этим дугам и для всех правил, соответствующих идентификаторам правил дуг q1 и q2 выполняется следующее соотношение Ri(q1).антецедент = Ri(q2).антецедент, где Ri(q).антецедент - антецедент правила Ri соответствующего i-му идентификатору правила дуги q, i = 1, ..., n, n -количество идентификаторов правил, связанных с дугой q.
Таким образом строится формальнологическая модель описывающая представление знаний, что позволит в дальнейшем формализовать структуру и функционирование интеллектуальной системы в целом.
разработанная экспертная система, входящая в комплекс интеллектуальной системы поддержки принятия решений в области водоподготовки и водоочистки, применялась при планировании и выполнении областной целевой программы «Обеспечение населения Самарской области питьевой водой» на 2005-2010 годы».
Список литературы
- Гаврилова Т. А., Червинская К. Р. Извлечение и структурирование знаний для экспертных систем. - М.: Радио и связь, 1992. - 200с.
- Гилев С.Е., Леонтьев С.В., Новиков Д.А. Распределенные системы принятия решений в управлении региональным развитием: М.: ИПУ РАН, 2002. - 52 с.
- Журба М.Г., Соколов Л.И., Говорова Ж.М. Водоснабжение. Проектирование систем и сооружений: Издание второе, переработанное и дополненное - М.: Издательство АСВ, 2004. - С. 495.
- Областная целевая программа «Обеспечение населения Самарской области питьевой водой» на 2005-2010 годы». Закон Самарской области от 28 декабря 2004 года № 177-гД «Об утверждении областной целевой программы «Обеспечение населения Самарской области питьевой водой» на 2005-2010 годы».
- Орлов С.П. Информационноуправляющая система для территориального водоснабжения // Вестник СамгТу. Серия Технические науки. - 2008, № 2(22). - С. 111-118.
- Орлов С.П, Чуваков А.В., Нечаев Д.А. разработка интеллектуальной системы поддержки принятия решений в области водоподготовки и водоочистки природных вод: Труды восьмой Всероссийской межвузовской научно-практической конференции/ Самрский гос. тех. ун-т. - Самара 2009. С. 194-198.
- Рыбаков А.А. Автоматизированное проектирование экспертных систем для защиты информации в локальных вычислительных сетях: дис. канд. техн. наук. - Рязань 2004. С. 103-105.