Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,279

HIDDEN MARKOV MODEL OF A REDUNDANT HOT STANDBY SYSTEM WITH A SINGLE RECOVERY DEVICE

Sidorov S.M. 1
1 Federal State Budgetary Educational Institution of Higher Education “MIREA – Russian Technological University”
2388 KB
Redundancy remains an important method for increasing the efficiency of technical systems for various purposes, and in some areas, it is critically necessary. Developing mathematical models of systems with complex structures, stochastic operation, and incomplete observability of internal states is a crucial task. Therefore, the aim of this study is to develop a hidden Markov model of a redundant hot standby system with a single recovery device based on its merged semi-Markov model for analyzing its dynamics and predicting its states. To achieve this goal, we used mathematical modeling, semi-Markov process theory, and hidden Markov modeling methods. We have constructed a semi-Markov model for a redundant system with hot standby and a single repair device under the assumption that the time-to-failure of system components follows random variables with distribution functions in general form, while the repair times are exponentially distributed. We have found the stationary distribution of the embedded Markov chain in explicit form, which made it possible to construct a merged model by using the stationary phase merging algorithm. This article proposes a new hidden Markov model based on its merged semi-Markov model. It allows for the identification of failed system components (based on information obtained during operation), prediction of subsequent states, refinement of the transition probability matrix, determination of the most probable sequences of states, etc. The capabilities of the developed model are demonstrated using an illustrative example.
redundant system
semi-Markov model
hot standby
limited recovery
stationary phase merging algorithm
hidden Markov model
dynamics analysis

Введение

Высокая надежность технических систем различного назначения достигается за счет использования резервирования. Дублированная система (ДС) представляет собой систему, состоящую из двух параллельно соединенных компонентов, выполняющих общую функцию, в которой один из компонентов выступает в качестве резерва [1, с. 58]. Под горячим резервом понимается нагруженный резерв, то есть что резервный компонент тоже находится в режиме работы. В этом случае система находится в рабочем состоянии до тех пор, пока хотя бы один ее компонент работоспособен.

На протяжении последних 60 лет для моделирования и анализа ДС исследователями использовались различные случайные процессы. ДС являются основой теории надежности и могут быть найдены во многих практических приложениях, например в компьютерных системах в промышленности и военном деле, на электростанциях и распределительных устройствах, а также в системах электронных телефонных станций [2]. Обзор основных научных результатов, посвященных ДС, за период с 1960 по 2000 г. можно найти в [2]. В.В. Рыков и соавт. использовали разложимые полурегенеративные процессы с конечным множеством состояний, ограничиваясь случаем идентичных компонентов, для анализа надежности ДС с холодным резервом и одним восстанавливающим устройством [3]. Р. Малхотра и соавт., используя полумарковский процесс и методы регенерации, провели оценку и сравнение показателей надежности и эффективности двухкомпонентной системы холодного резерва и горячего резерва с одним восстанавливающим устройством [4]. Н. Кумар и соавт. получили характеристики надежности системы холодного резерва, состоящей из двух неидентичных компонентов с одним восстанавливающим устройством, в предположении, что распределения интенсивности отказов компонентов имеют отрицательную экспоненциальную зависимость, в то время как для интенсивностей восстановления приняты произвольные распределения. Для этого ими использовался полумарковский процесс и методы регенерации для исследования вероятностного поведения системы в различных возможных переходных состояниях [5]. Ю.Е. Обжерин и С.М. Сидоров разработали полумарковскую модель с дискретно-непрерывным фазовым пространством состояний дублированной системы с нагруженным резервом и ограниченным восстановлением. Это позволило получить результаты в более общем виде: в предположении, что времена безотказной работы и восстановления всех элементов системы имеют распределение общего вида [6].

Наличие у полумарковского процесса вложенной цепи Маркова (ВЦМ) позволяет построить на ее основе скрытую марковскую модель (СММ). Если предположить, что состояния системы (состояния ВЦМ) рассматриваются как ненаблюдаемые, то это приводит к задачам определения наиболее вероятной последовательности переходов состояний, прогнозированию будущих состояний на основе наблюдаемых сигналов, полученных в процессе работы системы и др. [7].

Несмотря на большую популярность использования СММ в различных реальных прикладных задачах, их применение в задачах надежности относительно невелико [8]. Однако в последние годы интерес исследователей к данной области растет. Для решения задач теории СММ применительно к моделям надежности технических систем, можно использовать метод построения СММ на основе укрупненного полумарковского процесса (ПМП) с дискретно-непрерывным фазовым пространством состояний [9; 10]. Он позволяет применять аппарат теории СММ к полумарковским моделям систем. Скрытая модель может предоставить ключевую информацию о состоянии системы, такую как отказавший компонент системы, надежность системы и связанные с этим показатели. Она также позволяет решать задачи оценки матрицы переходных вероятностей дискретной цепи Маркова и матрицы связи с сигналами [11].

Цель исследования – разработка скрытой марковской модели дублированной системы с горячим резервом и одним восстанавливающим устройством на основе ее укрупненной полумарковской модели для анализа динамики и прогнозирования состояний.

Материалы и методы исследования

Для решения задачи использовались методы математического моделирования, теории ПМП и СММ. Для разработки полумарковской модели ДС использовалась теория ПМП с дискретно-непрерывным фазовым пространством состояний (ФПС) [12, с. 44–53; 13, с. 5–7]. Сначала в работе построена полумарковская модель рассматриваемой системы, предполагая, что времена восстановления компонентов распределены экспоненциально, а времена безотказной работы заданы распределениями общего вида. Затем осуществляется переход к укрупненной полумарковской модели, применяя алгоритм стационарного фазового укрупнения [12, с. 74–79]. Это позволило перейти от дискретно-непрерывного пространства состояний полумарковской модели к дискретному и использовать аппарат теории СММ для анализа динамики укрупненной системы. Затем разрабатывается СММ рассматриваемой укрупненной системы, решаются основные задачи теории СММ.

Представленные в статье расчеты проведены при помощи разработанной автором программы ЭВМ [14] на языке Python.

Результаты исследования и их обсуждение

Описание системы. Система S состоит из двух различных компонентов K1 и K2. При построении полумарковской модели будем учитывать следующие предположения:

− В момент начала работы S оба компонента новые и начинают работать.

− Времена безотказной работы компонентов описываются случайными величинами (СВ) α1 и α2 с функциями распределения (ФР) , и плотностями распределения f1(t), f2(t), а времена восстановления элементов – СВ β, имеющей ФР и плотность распределения g(t).

− Компонент K2 находится в горячем резерве.

− Имеется только одно восстанавливающее устройство. После окончания восстановления компонент мгновенно начинает работать и считается «как новый».

− Отказ ДС наступает тогда, когда в отказе находятся оба компонента, и продолжается до восстановления одного из них.

− СВ α1, α2, β предполагаются независимыми,

,

.

Построение полумарковской модели. Опишем функционирование системы S ПМП ξ(t) с дискретно-непрерывным ФПС [6]. Вводится следующее множество E полумарковских состояний:

(1)

где используется следующая смысловая кодировка:

− 1 определяет начальное состояние: оба компонента начинают работать;

− состояния представляют собой набор: i – указывает номер компонента, изменение состояния которого привело к изменению состояния системы S; компоненты вектора определяют физические состояния компонентов системы, учитывая что

определяет время до следующей смены состояния в элементе с номером отличным от i.

Например, состояние 202x означает, что изменение состояния произошло с K2: K1 восстанавливается восстановление (d1 = 0), K2 отказал и перешел в режим ожидания восстановления (d2 = 2), до момента восстановления K1 осталось время x ≥ 0.

На рис. 1 представлено функционирование системы S во времени. Периоды ожидания компонентом восстанавливающего устройства отмечены жирной линией.

Рис. 1. Функционирование системы S во времени Примечание: составлен автором в ходе исследования

Опишем ПМП ξ(t) через соответствующий ему процесс марковского восстановления (ПМВ) [12, с. 12]. Для этого нужно определить вероятности переходов ВЦМ и распределение времен пребывания на ее переходах.

Приведем вероятности переходов ВЦМ.

(2)

Времена пребывания в состояниях системы несложно определить по рис. 2, например:

Таким образом, задан ПМВ , а следовательно, и соответствующий ему ПМП ξ(t), описывающий функционирование системы S.

Рассмотрим частный случай рассматриваемой системы, когда времена восстановления элементов имеют экспоненциальное распределение, то есть

Составим систему интегральных уравнений для нахождения стационарного распределения, используя (1) и (2), в предположении существования стационарных плотностей:

(3)

Для стационарного распределения ВЦМ верна следующая лемма.

Лемма. Стационарное распределение ВЦМ , удовлетворяющее системе (3), имеет следующий вид:

(4)

где ρ0 – константа, которая находится из условия нормировки

,

Доказательство. Покажем, что (4) является решением (3).

Лемма доказана.

Построение укрупненной полумарковской модели (УПММ). Построим УПММ системы S, применяя алгоритм стационарного фазового укрупнения [12, с. 74–79]. Для этого необходимо:

− задать укрупненное ФПС Ê, в соответствии с исходным ФПС;

− вычислить вероятности перехода между состояниями, входящими в Ê,

− вычислить средние времена пребывания в состояниях, входящих в Ê.

Отметим, что, так как средние времена пребывания в состояниях не используются при построении СММ, они не приводятся в работе.

Разобьем ФПС E исходной модели на N = 8 непересекающихся подмножеств таким образом, чтобы каждое из них соответствовало одному состоянию УПММ:

При таком разбиении коды ФПС УПММ будут иметь такой же физический смысл, что и коды ФПС E. Это объясняется тем, что мы укрупняем лишь непрерывные компоненты x для указанных классов. Следует отметить, что x неизвестны для реальных систем и задают остаточные времена действия случайных факторов, изменяющих состояния системы.

Таким образом, в этом случае ФПС Ê УПММ имеет вид

(5)

Определим вероятности перехода между состояниями, входящими в Ê, которые, согласно [12, с. 36; 10], находятся по формуле и будут в дальнейшем использоваться для построения СММ:

(6)

где ρ(dx) – стационарное распределение ВЦМ , заданное формулами (4); – вероятности перехода ВЦМ .

Используя формулы (2), (4), (6) и полумарковскую модель системы S, получим

(7)

остальные , обозначает знак минимума.

Построение скрытой марковской модели. Определим СММ [9; 10]:

1. Множество состояний СММ соответствует множеству (5).

2. Матрица переходных вероятностей между состояниями системы состоит из переходных вероятностей (7).

3. Предположим, что во время функционирования системы S состояния ВЦМ укрупненной модели скрыты. Заметим, что это предположение оправдано для большинства технических систем. Зададим множество сигналов модели таким образом, чтобы сигнал соответствовал информации, которую можно было бы получить практически для любой технической системы. Тогда множество сигналов модели имеет вид

J = {0, 1, 2}, (8)

где 0 – система неработоспособна (отказ);

1 – система работоспособна: функционирует только один компонент (неизвестно, какой именно);

2 – система работоспособна: K1 и K2 функционируют.

Таблица 1

Связь R(s | x) состояний с сигналами

Состояние, x

Сигнал, s

«Старт»

111

211

101

210

110

201

120

202

s = 0

0

0,01

0,01

0,01

0,01

0,01

0,01

0,98

0,98

s = 1

0

0,01

0,01

0,98

0,98

0,98

0,98

0,01

0,01

s = 2

1

0,98

0,98

0,01

0,01

0,01

0,01

0,01

0,01

Примечание: составлена автором на основе полученных данных в ходе исследования.

4. Зададим связь между состояниями ВЦМ УПММ и сигналами (8), определив функцию связи R(s | x) [15], которая представлена в табл. 1. Отметим, что указанные в табл. 1 вероятности сигналов выбраны так, что сигнал для соответствующих состояний, кроме начального, может определяться с ошибкой.

5. В начальный момент времени УПММ находится в состоянии «старт», из которого она может перейти только в 101 или 210 с вероятностями

или

соответственно. Переходы в остальные состояния из состояния «старт» невозможны.

Пункты 1–5 полностью описывают СММ на основе УПММ.

Следуя [9; 10], используем построенную СММ для анализа УПММ. Проведем анализ и прогнозирование состояний УПММ на основе построенной СММ, следуя [15; 16, с. 269–275].

Иллюстративный пример. Рассмотрим систему S, для которой:

1) среднее время восстановления обоих элементов Mβ = 2 ч, то есть μ = 0,5;

2) средние времена безотказной работы первого и второго элементов равны Mα1 = 30 ч и Mα2 = 25 ч соответственно, а СВ α1, α2 имеют следующие распределения:

Случай 1. Эрланга IV порядка с параметрами λ1 = 2/15 и λ2 = 4/25, k = 4 (Mα1 = 30 ч, Mα2 = 25 ч).

Случай 2. Релея с параметром и показательное с параметром λ2 = 1/25 (Mα1 = 30 ч, Mα2 = 25 ч).

Случай 3. Вейбулла с параметрами λ = 33,6; k = 3 и Эрланга IV порядка с параметром λ2 = 4/25, k = 4 (Mα1 = 30,004 ч, Mα2 = 25 ч).

Случай 4. Вейбулла с параметрами λ = 33,6; k = 3 и показательное с параметром λ2 = 1/25 (Mα1 = 30,004 ч, Mα2 = 25 ч).

Предположим, что в результате функционирования системы S получен следующий вектор сигналов (n = 30):

Отметим, что в силу специфики рассматриваемой модели, при задании вектора сигналов необходимо учитывать следующее:

− после сигнала «2» всегда следует сигнал «1»;

− после сигнала «0» всегда следует сигнал «1»;

− после сигнала «1» может стоять либо сигнал «2», либо сигнал «0».

С использованием разработанной СММ получены следующие результаты:

1. УПММ находилась в состояниях с соответствующими вероятностями, представленными в табл. 2, на 30-м шаге (в момент испускания 30-го сигнала).

Таблица 2

Вероятность нахождения модели в состояниях на 30-м шаге

Состояние

111

211

101

210

110

201

120

202

Случай 1

0

0

0,4569

0,5423

0,0004

0,0004

0

0

Случай 2

0

0

0,4545

0,5447

0,0004

0,0004

0

0

Случай 3

0

0

0,4580

0,5412

0,0004

0,0004

0

0

Случай 4

0

0

0,4546

0,5446

0,0004

0,0004

0

0

Примечание: составлена автором на основе полученных данных в ходе исследования.

2. Прогноз состояний. УПММ переходит в следующее состояние на 31-м шаге с вероятностями (прогноз состояния), представленными в табл. 3.

Таблица 3

Прогноз состояния модели на 31-м шаге

Состояние

111

211

101

210

110

201

120

202

Случай 1

0,4209

0,5066

0

0

0

0

0,0361

0,0364

Случай 2

0,4212

0,5090

0

0

0

0

0,0361

0,0337

Случай 3

0,4219

0,5055

0

0

0

0

0,0360

0,0365

Случай 4

0,4213

0,5087

0

0

0

0

0,0363

0,0337

Примечание: составлена автором на основе полученных данных в ходе исследования.

3. Сигналы на следующем 31-м шаге (прогноз сигнала) появляются с вероятностями:

случай 1: сигнал 2 с вероятностью 0,90966, 0 – 0,08034, 1 – 0,01;

случай 2: сигнал 2 с вероятностью 0,91233, 0 – 0,07767, 1 – 0,01;

случай 3: сигнал 2 с вероятностью 0,90963, 0 – 0,08037, 1 – 0,01;

случай 4: сигнал 2 с вероятностью 0,91214, 0 – 0,07786, 1 – 0,01.

4. Вероятность появления (испускания) вектора сигналов s30:

случай 1: s30 = 0,018481; случай 2: s30 = 0,017874;

случай 3: s30 = 0,018494; случай 4: s30 = 0,017918.

5. Определение наиболее вероятной последовательности смены состояний. Для вектора сигналов s30 найдем наиболее вероятные состояния (состояния с максимальной вероятностью из возможных состояний на каждом переходе) СММ на переходах. В табл. 4 указаны наиболее вероятные состояния СММ на указанных в ней переходах с соответствующими вероятностями.

Таблица 4

Состояния СММ на переходах с максимальной вероятностью

Случай 1

Номер перехода

4

9

14

19

21

22

29

Состояние

210

211

210

211

120

201

211

Вероятность

0,52208

0,54115

0,55048

0,56539

0,44589

0,44589

0,55115

Случай 2

Номер перехода

4

9

14

19

21

22

29

Состояние

210

211

210

211

120

201

211

Вероятность

0,52934

0,54592

0,54670

0,55391

0,44166

0,44166

0,54702

Случай 3

Номер перехода

4

9

14

19

21

22

29

Состояние

101

211

210

211

202

110

211

Вероятность

0,50191

0,53296

0,55315

0,56793

0,44592

0,44592

0,55273

Случай 4

Номер перехода

4

9

14

19

21

22

29

Состояние

210

211

210

211

120

201

211

Вероятность

0,51801

0,54481

0,54680

0,55581

0,44197

0,44197

0,54716

Примечание: составлена автором на основе полученных данных в ходе исследования.

Из табл. 4 видно, что на 21-м и 22-м шаге для случая 3 наиболее вероятные состояния модели отличаются от других случаев, хотя они соответствуют физическому смыслу соответствующего сигнала.

6. Проведем обучение модели, то есть уточним параметры матрицы переходных вероятностей УПММ с целью их наиболее точного согласования с полученным вектором сигналов, используя алгоритм Баума – Велша [15]. На рис. 2 представлены исходная матрица переходных вероятностей и уточненная матрица переходных вероятностей , полученная в результате обучения.

Рис. 2. Матрицы и для разных случаев распределения случайных величин α1, α2. Примечание: составлен автором на основе полученных данных в ходе исследования

На рис. 2 столбцы и строки приведенных матриц соответствуют состояниям «Старт», 111, 211, 101, 210, 110, 201, 120, 202 в приведенной последовательности.

Для того, чтобы определить наиболее вероятную последовательность состояний, соответствующую вектору сигналов s30, кроме выбора на каждом шаге состояния с наибольшей вероятность (как в пункте 5), можно также использовать алгоритм Витерби [15; 16 с. 273–275]. Применим его к СММ с полученными после применения алгоритма Баума – Велша уточненными матрицами переходных вероятностей. Получим следующие последовательности состояний, наилучшим образом согласующиеся с s30:

− случай 1: «старт», 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 202, 110, 211, 101, 111, 210, 211, 101, 111, 210;

− случай 2: «старт», 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 202, 110, 211, 101, 111, 210, 211, 101, 111, 210;

− случай 3: «старт», 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 202, 110, 211, 101, 111, 210, 211, 101, 111, 210;

− случай 4: «старт», 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 111, 210, 211, 101, 202, 110, 211, 101, 111, 210, 211, 101, 111, 210.

Отметим, что после обучения модели получаются одинаковые последовательности наиболее вероятных состояний для всех случаев распределения СВ α1, α2.

Заключение

В данной работе построена СММ на основе укрупненной полумарковской модели ДС горячего резервирования. Для различных распределений времен безотказной работы компонентов системы решены задачи прогнозирования последующих состояний и сигналов, определения наиболее вероятной последовательности смены состояний для заданного вектора сигналов и др. Разработанная СММ позволяет также получить решения представленных задач при различных ошибках в сигналах. Показано, что после обучения модель дает одинаковый результат для последовательностей наиболее вероятных состояний при различных случаях распределения СВ α1, α2, но одинаковых значениях Mα1, Mα2. В дальнейшем планируется построение СММ дублированных систем различной структуры и разработка СММ с непрерывными наблюдениями.