Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

METHOD FOR ASSESSING STRUCTURAL RELIABILITY COMPUTING COMPUTER NETWORKS

Retyunskikh S.N. 1
1 Russian Customs Academy
The article considers computational computer networks as complex technical systems in which all components of subnets of different hierarchical levels participate in solving a common information problem; describes a method available for practical use to assess the structural (structural-circuit) reliability of computational computer networks as the ability of a multi-level network to function and perform tasks set in technical conditions in case of failures of individual networks (network elements); a method is formulated for determining the structural reliability of computing computer networks as an integrated assessment of the probabilistic operable functioning of the system under various technical conditions of network elements; an indicator is proposed for assessing the structural (structural-circuit) reliability of computing computer networks – operating time for a functional network failure (Tnet), measured in units of time; an example of calculating the operating time for a functional failure of a regional computer network consisting of local area networks connected by a “bridge” scheme is given, which shows that the Tnet indicator more fully reflects the properties inherent in the structure of regional computer networks to preserve the ability to perform specified functions in the event of failures of individual elements of a multi-level network, compared with the reliability indicators currently used; a promising direction of using the Tnet indicator is proposed by rationing it for the designed and existing computing computer networks in order to coordinate the technical and economic interests of the customer, developer, manufacturer and operator, as well as ensuring maximum reliability of computing computer networks at optimal costs at all stages of operation.
information technologies
computing computer networks
complex technical systems
structural reliability
logical-probabilistic method
operating time for functional network failure

Современный мировой научно-технический прогресс в значительной мере обусловлен инновационным развитием информационных технологий (ИТ). Совершенствование ИТ способствует созданию автоматизированных информационных систем (АИС), применяемых в основных сферах жизнедеятельности, а именно: организационно-управляющих, управления технологическими процессами, автоматизированного проектирования, проведения научных исследований и других перспективных отраслях. Одной из основных обеспечивающих подсистем функционирования АИС, наряду с совокупностью баз (банков) данных и информационных технологий, являются вычислительные компьютерные сети (ВКС), фактически реализующие информационные процессы через внутрисетевые связи и иерархические уровни взаимодействия различных типов сетей.

В работе [1] проанализированы структуры построения ВКС по различным иерархическим уровням. Предложенная аналитическая и графическая схема структуры вычислительных компьютерных сетей включает представленные в формализованном и аббревиатурном обозначении следующие основные элементы сетей: глобальные вычислительные сети – Wide Area Network (ГВС – WAN), далее по тексту – ГВС; региональные вычислительные сети – Metropolitan Area Network (РВС – MAN), далее по тексту – РВС; локальные вычислительные сети – Local Area Network (ЛВС – LAN), далее по тексту – ЛВС; рабочие станции сети – Network Workstations (РС – NW), далее по тексту – РС; серверы сети – Network Server (СС – NS), далее по тексту – СС. Использование предложенной схемы позволяет в рамках настоящей статьи рассматривать ВКС как сложные технические системы (СТС), в которых все составляющие подсети разных уровней участвуют в решении общей информационной вычислительной задачи.

В конечном результате важно не то, как работает каждая вычислительная сеть на своём уровне, а важна максимальная вероятность выполнения поставленной задачи конкретной структурно и функционально сложной вычислительной компьютерной сетью. Для оценки и прогнозирования уровня такой вероятности, на всех этапах проектирования и эксплуатации ВКС, необходима разработка показателя безотказности вычислительных компьютерных сетей как сложных технических систем.

Материалы и методы исследования

Классическое определение СТС приведено в работах [2, 4]: «Сложная техническая система – это объект, представляющий собой совокупность элементов, взаимодействующих в процессе выполнения определенного круга задач и взаимосвязанных функционально».

Вычислительные компьютерные сети соответствуют основным отличительным признакам сложных технических систем, а именно:

1. Содержат взаимосвязанные элементы (ГВС – WAN, РВС – MAN, ЛВС – LAN, РС – NW, СС – NS), которые взаимодействуют между собой и обладают глубоким функциональным и структурным резервированием.

2. Имеют возможность выполнения заданных функций (поставленной вычислительной информационной задачи) несколькими различными способами (разным составом элементов), отличающимися уровнями надёжности и качества функционирования.

3. Могут представляться сетями различных иерархических уровней, безотказная работа которых обеспечивает общую цель надежного функционирования всей системы.

4. Подчинены алгоритмическому управлению, имеющему иерархическую структуру, и обладают разветвленной сетью обмена управляющими сигналами и информацией.

5. Работают в общем контуре внешней среды и равновероятно подвержены разнонаправленному воздействию случайных факторов.

Таким образом, вычислительные компьютерные сети относятся к структурно-сложным техническим системам, и для оценки их надежности необходимо использовать методы теории сложных систем. Любая система может находиться равновероятно в двух состояниях – работоспособном или неработоспособном. Сложные технические системы, в частности ВКС, могут решать поставленную задачу различными способами, каждый из которых характеризуется составом работоспособных элементов (ГВС – WAN, РВС – MAN, ЛВС – LAN, РС – NW, СС – NS). Значит, отказ подсети (подсетей) или элемента (элементов) ВКС может привести к полной или частичной потере функциональной работоспособности сети и, в зависимости от этого, к снижению качества и вероятности выполнения вычислительной информационной задачи. При полной потере работоспособности возникает полный функциональный отказ сети, при частичной – частичный функциональный отказ [2-4]. Каждое состояние частичного отказа системы характеризуется определенным уровнем качества функционирования ВКС. Разработаны различные методы [4, 5] оценки эффективности функционирования сложных систем, позволяющие учесть характеристики качества функционирования отдельных элементов и степень их влияния на эффективность сети в целом.

Среди современных аналогичных исследований на настоящую тему наиболее актуальными представляются разработки группы авторов [6], в которых предлагаются способы решения задач, позволяющих обеспечивать заданные требования к надёжности сложной электронной системы путём оптимизации конструкторских решений, доработок схемотехники, выполнения оценочных процедур системы качества, многоуровневых испытаний опытных образцов. Для реализации этих мероприятий предлагается значительно затратная «концепция реализации непрерывной информационной поддержки программы обеспечения надёжности в части расчета показателей безотказности» СТС нового поколения.

В настоящей работе предложен метод оценки структурной надежности ВКС, который позволяет оптимизировать затраты на обеспечение надёжности вычислительных компьютерных сетей, путём применения доступной на практике методики оценки структурной надежности ВКС с помощью логико-вероятностного метода.

Под структурной (конструктивно-схемной) надежностью сложной (технической, информационной, вычислительной и т.п.) системы понимают свойство объекта сохранять способность выполнять заданные функции при отказах отдельных элементов сети [3–5]. Так как ВКС в процессе функционирования может находиться в различных работоспособных состояниях, то с переходом из состояния в состояние изменяется и уровень её структурной надежности. Работоспособное состояние сети может характеризоваться различным уровнем вероятности или предлагаемой интегрированной оценкой этого показателя – наработкой на функциональный отказ сети (Tnet).

Рассмотрим способ вычисления показателя Tnet для сетей с произвольной монотонной структурой. В качестве исходных данных используются известные характеристики, описывающие интенсивности отказов, включённых в ВКС сетей (элементов), полученные априори или апостериори известными методами оценки надежности.

В качестве метода, позволяющего учесть различное влияние отказов элементов ВКС на вероятность её работоспособного состояния, используем логико-вероятностный метод исследования надежности сложных технических систем [4, 7, 8].

Предлагаемый показатель Tnet является вероятностным. Его значение рассчитывают на основе данных о структурном построении ВКС и безотказности её элементов (ГВС – WAN, РВС – MAN, ЛВС – LAN, РС – NW, СС – NS). При уточнении значений показателей безотказности элементов на этапах испытаний или начальном периоде эксплуатации, а также при введении конструктивных изменений в структуру ВКС можно вычислить новое значение показателя Tnet и сравнить с исходным значением.

Показатель Tnet отличается строгостью алгоритма и однозначностью результатов вычислений и может использоваться наряду с другими показателями – целевой эффективностью функционирования, технической и экономической эффективностью, характеристик условий функционирования сети и обслуживающего персонала и т.п., как составляющая характеристики эффективности функционирования ВКС.

Рассмотрим порядок формирования основного выражения для вычисления наработки на функциональный отказ ВКС из М элементов.

С помощью классической формулы для нахождения математического ожидания случайной величины [4, 5] получим выражение зависимости показателей безотказности подсетей и отдельных элементов сетей с показателем безотказности ВКС:

missing image file (1)

где F(t) – плотность вероятности нахождения сети в работоспособном состоянии;

R(t) – вероятность нахождения сети в работоспособном состоянии.

Проведем декомпозицию выражения (1) для ВКС как СТС:

missing image file (2)

где Wn(t) – вероятность нахождения ВКС в n-м работоспособном состоянии;

N – количество работоспособных состояний ВКС.

Для определения значения вероятности каждого работоспособного состояния ВКС используем логико-вероятностный метод исследования надежности сложных технических систем [7]. Реализация данного метода для вычисления показателя Tnet предполагает выполнение следующих операций:

1. Построение надежностно-функциональной схемы (НФС) сети.

2. Определение на основе НФС системы набора функций ее работоспособности в виде матриц кодов кратчайших путей успешного функционирования или минимальных сечений отказов.

3. Формирование кодов возможных состояний системы, определяемых состояниями ее элементов.

4. Выбор кодов работоспособных состояний системы с помощью функций ее работоспособности.

5. Сокращение размерности модели путем исключения из анализа заведомо и, при задании – вероятно неработоспособных состояний сети.

6. Формулирование правил перехода от логических функций состояний элементов системы к интенсивностям их отказов.

7. Расчет значения показателя Tnet путем сложения частных сумм, соответствующих каждому работоспособному состоянию системы.

Алгоритм реализации логико-вероятностного метода для исследования сложной системы на ЭВМ и способ сокращения размерности модели приведены в работе [8]. Их использование позволяет без значительных затрат машинного времени получить двоичную матрицу кодов работоспособных состояний системы

missing image file (3)

Тогда

missing image file (4)

где Pm(t) – значение вероятности безотказной работы m-го элемента сети.

После вынесения суммы за знак интеграла (выполнив подстановки в (1) выражений (3) и (4)) для нормального закона распределения Pm(t) получаем

missing image file (5)

Таким образом, с учётом алгоритма слагаемых выражения Аy, получаем следующее правило перехода к интенсивностям отказов подсистем (элементов сетей) от логических функций их состояний:

missing image file (6)

где missing image file – общее количество частных сумм, соответствующих Y-му состоянию системы;

missing image file – класс кода Y-го состояния системы;

missing image file – величина, характеризующая знак d-й частной суммы;

missing image file – класс кода d-й частной суммы;

missing image file – двоичная матрица кодов частных сумм, соответствующих Y-му состоянию системы;

missing image file – значение интенсивности отказа m-го элемента.

Первая строка матрицы совпадает с кодом Y-го работоспособного состояния системы, а каждая последующая отличается двоичной комбинацией «1» и «0» в нулевых разрядах кода первой строки. Соответственно, значения всех разрядов кода последней (Dy-й ) частной суммы равны единице.

Таким образом, с учетом (5) и (6), окончательное выражение имеет вид:

missing image file (7)

Результаты исследования и их обсуждение

Для примера вычислим значение наработки на функциональный отказ региональной вычислительной сети, состоящей из ЛВС, соединенных по «мостиковой» схеме (рисунок).

При построении по указанной схеме сеть имеет шестнадцать работоспособных состояний. Код первого работоспособного состояния 11111 (функционируют все пять ЛВС), второго – 11110 (функционируют 1-я, 2-я, 3-я и 4-я ЛВС), десятого – 10011 (функционируют 1-я, 4-я и 5-я ЛВС), шестнадцатого – 01001 (функционируют 2-я и 5-я ЛВС).

Порядок формирования слагаемых показателя Tnet приведен в таблице.

Если принять значения используемого в настоящее время показателя оценки безотказности технических систем – средней наработки на отказ и повреждение (Тс) одинаковыми для всех составляющих РВС мостиковой структуры (ЛВС1, ЛВС2, ЛВС3, ЛВС4, ЛВС5) ТсЛВС = 100 ч, то интенсивности отказов ЛВС μ1, μ2, μ3, μ4, μ5 одинаковы и равны 1/ТсЛВС, т.е. 1/100 ч. Значит, средняя наработка на отказ и повреждение РВС [4, 5]:

ТсРВС = 1 / (μ1 + μ2 + μ3 + μ4 + μ5) = 20 ч.

missing image file

Надёжно-функциональная схема РВС «мостиковой» структуры

Порядок формирования слагаемых показателя Tnet

Номер работоспособного состояния (Y)

1

2

10…

Код работоспособного состояния (Xyn)

11111

11110

10011

Класс кода (ry)

0

1

2

Значение, рассчитанное для вероятности нахождения системы в Y-м работоспособном состоянии (Wy)

P1*P2*P3*P4*P5

P1*P2*P3*P4 -

P1*P2*P3*P4*P5

P1*P4*P5 -

P1*P2*P4*P5 -

P1*P3*P4*P5 +

P1*P2*P3*P4*P5

Количество частных сумм (My)

1

2

4

Номер частной суммы (m)

1

1

2

1

2

3

4

Код частной суммы (missing image file)

11111

11110

11111

10011

11011

10111

11111

Класс кода

0

1

0

2

1

1

0

Знак частной суммы

> 0

> 0

< 0

> 0

< 0

< 0

> 0

Модуль значения частной суммы

ƛ1+ ƛ2+ ƛ3+ ƛ4+ ƛ5

ƛ1+ ƛ2+ ƛ3+ ƛ4

ƛ1+ ƛ2+ ƛ3+ ƛ4+ ƛ5

ƛ1+ ƛ4+ ƛ5

ƛ1+ ƛ2+ ƛ4+ ƛ5

ƛ1+ ƛ3+ ƛ4+ ƛ5

ƛ1+ ƛ2+ ƛ3+ ƛ4+ ƛ5

Для сравнения, наработка на функциональный отказ РВС, состоящей из ЛВС мостиковой структуры с аналогичными показателями Тс, рассчитанная с помощью формулы (7), составляет Tnet = 81,7 ч.

Следовательно, показатель Tnet более полно отражает заложенные в структуру ВКС как сложной технической системы свойства сохранять способность выполнять заданные функции при отказах отдельных элементов.

Заключение

Таким образом, предлагаемый показатель безотказности вычислительных компьютерных сетей – наработка на функциональный отказ сети (Tnet) – обладает следующими преимуществами по сравнению с используемыми в настоящее время показателями надежности:

1. Учитывает наличие резерва в сети, однозначно зависит от структуры ВКС.

2. Является вероятностным, не требует накопления статистического материала об отказах ВКС. Рассчитывается на основе данных о безотказности подсетей и элементов сетей, при их уточнении корректируется.

3. Использует строгий алгоритм вычислений. Окончательное выражение легко реализуется на ЭВМ без значительных затрат вычислительных ресурсов.

Перспективным направлением использования показателя Tnet является его нормирование для проектируемых и действующих вычислительных компьютерных сетей с целью согласования технических и экономических интересов заказчика, разработчика, производителя и эксплуатанта, а также обеспечения максимальной надежности их работы при оптимальных затратах на всех этапах функционирования вычислительных компьютерных сетей различных иерархических уровней.