БАЙЕСОВСКИЙ ПОДХОД К УЧЕТУ ЭПИСТЕМИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ ПАРАМЕТРОВ ВЕРОЯТНОСТНЫХ МОДЕЛЕЙ АНАЛИЗА РИСКА ПРИНИМАЕМЫХ РЕШЕНИЙ

Птушкин А.И. 1 Решетников Д.В. 1 Шаповалов Д.В. 1 Степенко А.Н. 1

1 ФГБВОУ ВО «Военно-космическая академия имени А.Ф. Можайского» МО РФ

Рассматривается проблема снижения уровня неопределенности знаний о параметрах вероятностных моделей отказов, применяемых при анализе риска принимаемых решений. Предложено определение риска как одного из свойств решения, принимаемого в ситуации с неопределенными исходами. С целью получения дополнительных количественных знаний о параметрах вероятностных моделей отказов предлагается использовать байесовский подход. Представлена общая схема применения этого подхода. Продемонстрировано, что благодаря возможности использования широкодоступных прикладных программ, содержащихся в электронной таблице Excel, применение этого подхода стало характеризоваться простотой и существенно меньшей трудоемкостью по сравнению с общими подходами к исследованию неопределенности, базирующимися на теории доказательств Демпстера – Шефера или концепции вероятностей (гистограмм) второго порядка. Рассмотрено, как в процессе эксплуатации сложных технических устройств, используя предложенный подход, можно корректировать значения параметров математических моделей отказов, необходимых для анализа риска принимаемых решений, на примере двух законов распределения: биномиального и экспоненциального. Произведено сравнение априорных и апостериорных плотностей вероятности их параметров, свидетельствующее об уменьшении эпистемической неопределенности априорных распределений при учете дополнительных наблюдений. Даны рекомендации по использованию разработанного подхода для анализа риска принятий решений на эксплуатационной стадии жизненного цикла продукции.

Статья в формате PDF

0 KB

эпистемическая неопределенность

риск

доверительный интервал

байесовский подход

априорная и апостериорная плотности распределения вероятности

сопряженное распределение

1. Звягин В.И., Птушкин А.И., Трудов А.В. Риск как одно из свойств качества решений, принимаемых в условиях неопределенности // Надежность. 2018. Т. 18. № 4. С. 45–50.

2. Шарый С.П. Конечномерный интервальный анализ. Новосибирск: Издательство «XYZ», 2020. 643 с.

3. Суворова А.В. Подходы к представлению и обработке неопределенности данных и знаний о поведении индивидов // Труды СПИИРАН. СПб.: СПИИРАН, 2012 № 23. С. 206–222.

4. Добронец Б.С., Попова О.А. Численный вероятностный анализ для исследования систем в условиях неопределенности // Вест. Томского гос. ун. Управление, вычислительная техника и информатика. 2012. № 4. С. 39–46.

5. NASA/SP-2009-569. Bayesian Inference for NASA Probabilistic Risk and Reliability Analysis. [Electronic resource]. URL: https://ntrs.nasa.gov/citations/20090023159 (date of access: 30.10.2020).

6. Сопряженное априорное распределение // Сайт «Nuances of programming». [Электронный ресурс]. URL: https://nuancesprog.ru/p/6436/ (дата обращения: 30.10.2020).

Принятие решений на всех стадиях жизненного цикла различных объектов всегда осуществляется при наличии неуверенности в том, что их выполнение приведет к достижению желаемой цели, а также опасения того, что это может привести к тяжелым последствиям. Свойство решения, характеризующее возможность и последствия недостижения его целей, будем называть свойством рискованности или, кратко, риском [1]. Для количественного анализа характеристик этого свойства широко используются математические модели, отражающие вероятностную природу неопределенностей, при наличии которых принимаются решения. Однако результаты их использования будут справедливы только тогда, когда у нас есть уверенность в точном знании как самих моделей, так и значений их параметров. В действительности полной уверенности в справедливости сделанных предположений и истинности численных значений используемых параметров никогда не бывает. Поэтому возникает необходимость в применении математических средств, которые бы позволили учесть неопределенность знаний, по крайней мере, о значениях параметров, применяемых вероятностных моделей. Неопределенность, обусловленная отсутствием достаточных знаний, называется эпистемической неопределенностью. Название происходит от лат. episteme – знание.

Существует несколько подходов к изучению эпистемической неопределенности с использованием количественных оценок. Прежде всего, следует назвать подходы, основанные на применении методов теории интервального анализа [2], теории доказательств Демпстера – Шефера [3] и концепции вероятностей второго порядка. Названные теории характеризуются высоким уровнем сложности и их систематическое применение для решения прикладных задач связано с необходимостью использования больших ресурсов. Поэтому актуальной является задача снижения уровня сложности применяемой технологии исследования системы, без ухудшения ее качества [4].

В настоящей статье рассматривается возможность использования байесовского подхода к учету неопределенности знаний параметров вероятностных моделей, используемых при обосновании решений, принимаемых на стадии эксплуатации технических устройств (ТУ).

Общая схема применения байесовского подхода

Правила преобразования априорных знаний о некотором параметре θ, в истинности значения которого есть сомнения, на основании полученных дополнитеольных данных x определяются формулой Байеса [5]:

π(θ|x) = ptyhkin01.wmf (1)

В этой формуле: f(x|θ) – условная плотность распределения наблюдаемого параметра x, если он изменяется непрерывно, или распределение Бернулли, если он изменяется дискретно; π(θ) – априорная плотность распределения параметра θ, которая характеризует априорные знания о параметре θ; интеграл в знаменателе берется по всему диапазону параметра θ; π(θ|x) – апостериорное распределение ненаблюдаемого параметра θ после получения дополнительной наблюдаемой информации x; интеграл в знаменателе вычисляется по интервалу изменения параметра θ.

На рис. 1 представлена обобщенная схема применения байесовского подхода к учету неопределенности параметров вероятностных моделей.

Ptuhk1.tif

Рис. 1. Обобщенная схема применения байесовского подхода

В общем случае определение апостериорной плотности распределения вероятностей случайных событий, например, отказов, в истинности значений которых нет уверенности, является сложным вычислительным процессом из-за необходимости вычисления интеграла в знаменателе формулы Байеса. Этот процесс существенно упрощается, если вычисления производить не с исходными априорными плотностями распределения, а с их сопряженными распределениями [5]. Распределение π(θ) называется сопряженным априорным распределением к семейству функций правдоподобия f(x|θ), если ее апостериорное распределение π(θ|x) принадлежит тому же семейству вероятностных распределений, что и априорное распределение π(θ) (т.е. имеет тот же вид, но с другими параметрами) [6].

Рассмотрим, как в процессе эксплуатации ТУ, используя байесовский подход, можно корректировать значения параметров математических моделей отказов, необходимых для анализа риска принимаемых решений, и сделаем это на примере двух законов распределения: биномиального и экспоненциального.

Коррекция параметра биномиального закона распределения

Биномиальное распределение имеет место, если выполняются следующие условия: существует два возможных результата выполнения требования, обычно интерпретируемых как успех и неудача; существует постоянная вероятность отказа в выполнении каждого требования; результаты более ранних требований не влияют на результаты более поздних требований (т.е. порядок неудач/успехов не имеет значения).

Будем полагать, что такие условия выполняются в процессе функционирования системы управления состоянием предохранительного клапана, предназначенного для снятия избыточного давления в ТУ. При выдаче контроллером команды (требования) на открытие клапана возможны два исхода: срабатывание клапана и сброс давления в ТУ и отказ в выполнении требования (отказ клапана).

Количество отказов m в выполнении n требований характеризуется распределением Бернулли

p(m|n, q) = ptyhkin02.wmf (2)

где q – вероятность невыполнения требования; n – количество требований, имевших место; m – количество наблюдаемых отказов в выполнении требований; ptyhkin03.wmf – число сочетаний из n по m; p(m|n, q) – вероятность невыполнения ровно m требований из n при вероятности невыполнения каждого требования q (функция правдоподобия).

Корректируемый параметр в этой модели, в истинности количественного значения которого есть сомнения, в данном случае – q, а наблюдаемые данные – количество требований n и количество отказов m в их выполнении. Предполагается, что m и n достоверно известны.

В данном случае имеет место следующее сопоставление принятых здесь обозначений с обозначениями в формуле Байеса (1):

q = θ, x = m, p (m|n, q) = f(x|θ),

π(q) = π(θ), π(q|m) = π(θ|x).

Сопряженным функции правдоподобия p(m|n, q) априорным распределением π(q) является бета-распределение, которое в принятых обозначениях имеет вид

π(q) = ptyhkin04.wmf q^α-1(1 – q)^{β – 1}, (3)

где B(α, β) = ptyhkin05.wmf ^α-1(1 – t)^β-1 dt – бета-функция [5].

Подставив (2) и (3) в формулу Байеса (1) и произведя несложные преобразования, получим выражение для апостериорного распределения не наблюдаемого параметра q после получения дополнительной наблюдаемой информации m

ptyhkin06.wmf

Нетрудно заметить, что интеграл в знаменателе этого выражения равен бета-функции B(α + m – 1, β + n – m – 1) и, следовательно, апостериорное распределение, так же как и априорное, представляет собой бета-распределение, но с другими параметрами и имеет вид

ptyhkin07.wmf (4)

В данном случае параметр альфа-априорного распределения α_апр концептуально можно рассматривать как количество невыполненных требований, а сумму (α_апр + β_апр) – как общее количество требований [5]. Зная апостериорные данные, состоящие из m отказов в n требованиях, можно определить параметры апостериорного распределения [5]:

α_апост = α_апр + m, (5)

β_апост = β_апр + n – m. (6)

Как отмечено выше, для исследования апостериорных и априорных распределений можно использовать встроенные функции электронной таблицы Microsoft Excel. Для получения плотности вероятности бета-распределения случайной величины используется функция БЕТА.РАСП, возвращающая функцию или плотность бета-распределения, а для получения границ байесовского доверительного интервала – функция БЕТА.ОБР, возвращающая обратную функцию бета-распределения.

Рассмотрим простой пример. Дано: априорная плотность распределения π(q) (3) с параметрами α_апр = 2; β_апр = 1000; апостериорные данные: количество требований n = 500, количество невыполненных требований m = 2.

Найти: параметры апостериорной плотности распределения π(q|m); средние значения вероятности того, что требование не будет выполнено при использовании априорной π(q) и апостериорной π(q|m) плотностей вероятности q; 90 % байесовские доверительные интервалы для q, используя априорную и апостериорную плотности ее распределения.

Решение. Параметры апостериорной плотности распределения π(q|m) αа_пост и β_апост определяем по формулам (5) и (6) соответственно: α_апост = 2 + 2 = 4 и β_апост = 1000 + + 500 – 2 = 1498.

Так как параметр q изменяется в пределах от 0 до 1, то его априорное и апостериорное средние значения могут быть определены по формулам

ptyhkin08.wmf

ptyhkin09.wmf

Ptuhk2.tif

Рис. 2. Сравнение априорной и апостериорной плотностей распределения вероятности параметра q

Для определения границ 90 % доверительного интервала для q воспользуемся функцией электронной таблицы Excel БЕТА.ОБР (…).

Левая граница этого интервала определяется значением q, при котором вероятность отказа в выполнении требования меньше 5 %, а правая – значением q, при котором в 95 % случаев имеет место отказ в выполнении требования. Формат обращения к программам вычисления левой и правой границ байесовского доверительного интервала имеет вид БЕТА.ОБР (0,05, α, β) и БЕТА.ОБР (0,95, α, β). Для α_апост = 4 и β_апост = 1498 получаем, что интересующий нас параметр q (вероятность невыполнения требования) с вероятностью 0,9 находится в интервале [9,11•10^-4; 5,16•10^-3] (байесовский интервал). Применив такую же процедуру для априорной плотности распределения с параметрами α_апр = 2, β_апр = 1000, получим, что этот параметр с вероятностью 0,9 находится в интервале [3,55•10^-4; 4,73•10^-3].

Проведенные расчеты свидетельствуют о том, что учет дополнительных наблюдений позволил уменьшить неопределенность знаний о значении параметра q, что иллюстрируется графиками, представленными на рис. 2.

Коррекция параметра экспоненциального закона распределения

При принятии решений в процессе эксплуатации технических устройств одним из самых распространенных факторов риска являются их отказы. Если эти отказы характеризуются следующими особенностями: вероятность отказа на небольшом временном интервале приблизительно пропорциональна его длине; вероятность одновременных отказов за короткий промежуток времени равна нулю; возникновение отказа в одном временном интервале не влияет на вероятность возникновения в другом, неперекрывающемся интервале времени (отсутствует последействие), то наблюдаемая случайная величина - время до наступления отказа характеризуется экспоненциальным законом распределения с плотностью распределения вероятности, которая имеет вид

f(t) = λ exp(-λt) при t ≥ 0. (7)

Сопряженным экспоненциальному распределению является гамма-распределение [6] с плотностью вероятности

π(λ|α, β) = ptyhkin10.wmf (8)

где Γ(α) – гамма-функция Эйлера.

Параметры α и β плотности распределения (8) в данном случае имеют следующую интерпретацию [5]: α – количество наблюдаемых интервалов безотказной работы, n; β – суммарная продолжительность интервалов безотказной работы.

Исходя из этой интерпретации, параметры апостериорной плотности вероятности ∞_апост и β_апост будем определять по формулам

∞_апост = ∞_апр + n, (9)

β_апост = β_апр + ptyhkin11.wmf , (10)

где Ti – продолжительность i-го интервала безотказной работы; ∞_апр и β_апр – значения параметров априорной плотности распределения.

Из свойств гамма-распределения следует, что среднее значение λ определяется отношением

λ_ср = ptyhkin12.wmf . (11)

Для определения левой и правой границ γ % доверительного интервала можно воспользоваться встроенной функцией электронной таблицы Excel ГАММА.ОБР (…) с соответствующими форматами обращения:

λлев = ГАММА.ОБР ptyhkin13.wmf (12)

λпр = ГАММА.ОБР ptyhkin14.wmf (13)

Рассмотрим пример.

Дано: результаты фиксации продолжительности работы циркуляционного насоса Ti в часах до 7 отказов (n = 7): 55707, 255092, 58776, 11646, 11358772, 875209, 68978; параметры априорной плотности вероятности ∞_апр = 1,6 и β_апр = 365000 ч.

Уточнить на основе выполненных наблюдений априорные сведения о параметре λ (интенсивности отказов), определив для него доверительный интервал с доверительной вероятностью γ = 90 % и среднее апостериорное значение ptyhkin15.wmf .

Решение. Определим суммарную продолжительность интервалов безотказной работы насоса ptyhkin16.wmf = 12782180 ч.

Теперь есть вся необходимая информация для определения по формулам (9) и (10) значений параметров α и β апостериорной плотности распределения вероятности:

∞_апост = ∞_апр + n = 1,6 + 7 = 8,6,

β_апост = β_апр + ptyhkin17.wmf , = 365000 + 12782180 = 13147180.

Зная эти параметры и используя формат обращения к программе вычисления границ байесовского доверительного интервала (12), определим его левую границу ptyhkin18.wmf = 3,4•10^-7 ч-1.

Используя формат (13), получим правую границу ptyhkin19.wmf = 1,1• 10^-6 ч-1.

Ptuhk3aa.tif

Ptuhk3a.tif

Рис. 3. Сравнение априорной и апостериорной плотностей распределения вероятности параметра λ

Таким образом, можно сделать вывод о том, что учет дополнительной информации об отказах насоса, полученной в процессе его эксплуатации, позволяет утверждать, что с вероятностью 0,9 интенсивность отказов насоса находится в интервале

λ^апост ∈ [3,4• 10^-7 ч-1, 1,1• 10^-6 ч-1]. (14).

Аналогичным образом можно определить априорный доверительный интервал

λ^апр ∈ [5,7• 10^-7 ч-1, 1,1• 10^-5 ч-1]. (15)

Этот интервал гораздо шире апостериорного интервала.

После получения дополнительной информации о функционировании насоса существенно смещается в сторону меньших значений среднее значение λ, определяемое по формуле (11): ptyhkin20.wmf = 6,7•10^-7 ч-1, ptyhkin21.wmf = 4,4•10^-6 ч-1.

Как и в предыдущем примере, проведенные расчеты свидетельствуют о том, что учет дополнительных наблюдений позволил уменьшить неопределенность знания интенсивности отказов насоса, что иллюстрируется графиками, представленными на рис. 3.

Снижение неопределенности знания параметра λ экспоненциального закона, естественно, приводит к снижению неопределенности знания одного из показателей риска – вероятности отказа циркуляционного насоса в течение заданного времени q(t) = 1 – exp(-λt).

Предположим, что одной из целей создания этого насоса является обеспечение его безотказной работы в течение 100000 ч. Тогда, подставив в эту формулу t = 100000, а затем последовательно значения λ, соответствующие левой и правой границам их апостериорного (14) и априорного (15) 90 % доверительных интервалов, получим аналогичные доверительные интервалы для апостериорной (16) и априорной (17) вероятностей недостижения цели создания насоса:

q_апост(100000) ∈ [0,033; 0,104], (16)

q_апр(100000) ∈ [0,055; 0,667]. (17)

Сравнение интервалов (16) и (17) показывает, что учет дополнительной информации об отказах насоса на основе применения байесовского подхода позволил получить существенно более точную интервальную оценку показателя риска недостижения цели.

Заключение

Изложенный материал наглядно иллюстрирует, что благодаря возможности использования прикладных программ, содержащихся в электронной таблице Excel, трудоемкость применения байесовского подхода для количественной оценки эпистемической неопределенности параметров законов распределения, применяемых при анализе риска принимаемых решений, и для которых сопряженными являются бета- или гамма-распределения, несравненно меньше, чем трудоемкость применения общих подходов к исследованию неопределенности, базирующимися на теории доказательств Демпстера – Шефера или концепции вероятностей (гистограмм) второго порядка. Это позволяет широко использовать его при анализе риска принятия решений на различных стадиях жизненного цикла продукции, а также в учебной деятельности.

Библиографическая ссылка

Птушкин А.И., Решетников Д.В., Шаповалов Д.В., Степенко А.Н. БАЙЕСОВСКИЙ ПОДХОД К УЧЕТУ ЭПИСТЕМИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ ПАРАМЕТРОВ ВЕРОЯТНОСТНЫХ МОДЕЛЕЙ АНАЛИЗА РИСКА ПРИНИМАЕМЫХ РЕШЕНИЙ // Современные наукоемкие технологии. 2020. № 11-1. С. 67-72;
URL: https://top-technologies.ru/ru/article/view?id=38340 (дата обращения: 19.07.2025).
DOI: https://doi.org/10.17513/snt.38340

Научный журнал
Современные наукоемкие технологии

ISSN 1812-7320

"Перечень" ВАК

ИФ РИНЦ = 1,172

Библиографическая ссылка

Современные наукоемкие технологии
Научный журнал | ISSN 1812-7320 | ПИ №77-63399