Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

LOGISTIC REGRESSION AS A MODEL FOR ASSESSING THE CONDITION OF PREMATURE NEWBORNS IN ORDER TO TRANSFER THEM TO NON-INVASIVE RESPIRATORY SUPPORT

Tyrsin A.N. 1, 2 Ulezko E.A. 3 Ostroushko D.V. 3 Svirskaya O.Ya. 3 Sankovets D.N. 3
1 Ural Federal University named after the first President of Russia B.N. Yeltsin
2 South Ural State University
3 Mother and Child National Research Center
For premature newborns with a gestation period of less than 30 weeks, the use of artificial lung ventilation is a widespread method of treatment. However, the delay in the transition from invasive ventilation to non-invasive respiratory support can contribute to the occurrence of various kinds of complications and loss of health. Therefore, a timely transition from artificial lung ventilation to non-invasive methods of treatment is an urgent task. The purpose of this article is to develop a method for assessing the condition of premature newborns with a gestation period of less than 30 weeks, which allows them to be transferred to non-invasive respiratory support in a timely manner. To solve this problem, a training sample of 52 premature newborns was formed, consisting of two groups of patients. The first group included patients who were on artificial lung ventilation for 7 days of observation. The second group included patients who were transferred during this period to natural ventilation of the lungs and are stable in this condition. Based on binary logistic regression, a mathematical model is proposed for classifying the health status of patients in order to determine the moment of transition of premature newborns to non-invasive respiratory support. A decisive rule for classifying the conditions of new patients has been obtained. For a training sample of 52 patients, the classification reliability was 100 %. The entropy analysis of the training sample of patients showed that before the transition to non-invasive respiratory support in newborns, there are a sharp decrease in the variation of indicators and a simultaneous increase in the tightness of the correlation between them.
model
logistic regression
preterm infants
forecast
non-invasive respiratory support
entropy

Для недоношенных новорожденных со сроком гестации менее 30 недель широко распространенным методом лечения является искусственная вентиляция легких (ИВЛ). Однако задержка перехода от инвазивной вентиляции легких к неинвазивной дыхательной поддержке может способствовать возникновению различного рода осложнений, повышенные риски ИВЛ-ассоциированных пневмоний и позднего сепсиса, возникновения эпизодов гипоксемии и гиперкапнии, брадикардии, нарушения мозгового кровотока и ателектаза, а также развитие в дальнейшем отклонений в неврологическом развитии ребенка [1, 2]. Ряд авторов отмечают, что успешность перехода с инвазивной на неинвазивную дыхательную поддержку составляет от 60 % до 86 % [3, 4]. Поэтому актуальной задачей является своевременный переход на неинвазивные методы лечения.

Однако принятие решения о переходе на неинвазивные методы лечения в настоящее время затруднено наличием многих недостаточно изученных факторов [5]. В результате врачи часто в таких случаях вынуждены при принятии решения также опираться на врачебный опыт и профессиональную интуицию, что может быть сопряжено с определенной долей ошибки. Поэтому представляет интерес использовать современные методы математического моделирования и многомерного статистического анализа и цифровые технологии [6–8]. Это облегчит врачам, независимо от уровня профессиональной подготовки и оснащенности современным оборудованием лечебного учреждения, выбор персонализированной терапевтической тактики для каждого пациента. Важным условием при этом является простота и доступность математических моделей для учреждений всех уровней оказания медицинской помощи.

В [9] описан метод оценки степени тяжести состояния недоношенных новорожденных со сроком гестации менее 30 недель. Он позволяет перед началом лечения оценить степень тяжести состояния здоровья, что позволяет выбрать инвазивный или неинвазивный вариант лечения. Однако остался нерешенным вопрос своевременного перехода с инвазивного на неинвазивный вариант лечения по индивидуальным показаниям пациента.

Цель данной статьи – разработка метода оценки состояния недоношенных новорожденных со сроком гестации менее 30 недель, позволяющего своевременно переводить их на неинвазивную респираторную поддержку.

Материалы и методы исследования

Из недоношенных новорожденных со сроком гестации менее 30 недель, проходящих лечение в ГУ «РНПЦ «Мать и дитя» (г. Минск), была сформирована обучающая выборка, состоящая из двух групп пациентов. В первую группу вошли 38 пациентов, которые все 7 дней наблюдения находились на ИВЛ (группа «ИВЛ» (Z = 0)). Во вторую группу вошли 14 пациентов, которые были переведены в течение этого периода на естественную вентиляцию легких (ЕВЛ) (группа «ЕВЛ» (Z = 1)) и стабильно находились в этом состоянии. Под стабильным состоянием считаем нахождение пациента не менее двух дней на ЕВЛ. Всего в выборке имеем 52 пациента. Решение задачи состоит в попытке определить момент снятия пациентов с ИВЛ, т.е. их перевода в группу «ЕВЛ».

В данные были включены: показатели анамнеза, кислотно-основного состояния (КОС) крови при рождении, а также ряд показателей текущего (посуточного) состояния здоровья пациентов. Анализируемые показатели приведены в табл. 1. Среднесуточные показатели брались как среднее значение за 7 суток (для группы «ИВЛ») и как среднее за последний день нахождения на ИВЛ (для группы «ЕВЛ»).

Схематично система мониторинга состояния пациентов, находящихся на ИВЛ, приведена на рисунке. Врач наблюдает за показателями состояния здоровья пациента и периодически при необходимости изменяет частоту искусственных вдохов, процент кислорода газовой смеси, подаваемой пациенту, и значение MAP либо принимает решение о переводе на неинвазивный вариант лечения по индивидуальным показаниям пациента.

Для практического использования методика оценки здоровья недоношенных новорожденных должна быть, с одной стороны, простой и понятной врачам. А с другой стороны, она должна опираться на достаточно строгую математическую модель, позволяющую легко интерпретировать полученные результаты. Этим условиям удовлетворяет логистическая регрессия [10, 11]. Однако для ее эффективного применения требуется удачно подобрать набор информативных признаков, позволяющих разделить множество наблюдений на кластеры.

Логистическая регрессия удобна тем, что позволяет формировать хорошо интерпретируемый показатель степени тяжести состояния здоровья в виде вероятности отнесения пациента к той или иной группе больных.

Таблица 1

Анамнестические и лабораторные данные

Данные

Признак

Обозн.

Анамнез

Пол: ж – 0 , м – 1

X1

Срок гестации (нед.)

X2

Масса при рождении (г)

X3

Беременность: 0 – одноплодная, 1 – многоплодная

X4

Метод родоразрешения: 0 – через естественные родовые пути, 1 – плановое кесарево сечение, 2 – экстренное кесарево сечение

X5

КОС при рождении

pH

X6

Lac

X7

Показатели посуточного состояния здоровья

Среднесуточная частота искусственных вдохов в минуту

X8

Среднесуточное значение FiO2 (% кислорода газовой смеси, подаваемой пациенту)

X9

Среднесуточное значение MAP (интегральный показатель настроек аппарата ИВЛ)

X10

Среднесуточное значение OI (интегральный показатель тяжести патологии)

X11

Среднесуточное значение SpO2 (уровень насыщения крови кислородом)

X12

Гемодинамический статус: 0 – нет терапии, 1 – допамин ≤ 5 мкг/кг мин, 2 – допамин > 5 и ≤ 10 мкг/кг мин, 3 – допамин > 10 мкг/кг мин или допамин+добутамин ≤ 10 мкг/кг мин, 4 – допамин+добутамин > 10 мкг/кг мин, 5 – эпинефрин или норэпинефрин и/или ГКС

X13

Среднесуточное значение pH

X14

Среднесуточное значение pCO2

X15

Среднесуточное значение pO2

X16

Среднесуточное значение ctO2

X17

Среднесуточное значение p50

X18

Среднесуточное значение crSO2 (показатели церебральной оксигенации. Среднее за 12 ч)

X19

Среднесуточное значение ∆crSO2 (за 12 ч (макс-мин)

X20

missing image file

Система мониторинга состояния пациентов, находящихся на ИВЛ

Применительно к двум классам это выглядит следующим образом. Имеем обучающую выборку данных из n наблюдений

missing image file, missing image file,

где missing image file– i-е наблюдение,

missing image file; missing image file

missing image file – бинарная переменная, указывающая на принадлежность i-го наблюдения соответствующей группе (пусть первой группе при missing image fileи второй – при missing image file); m – число признаков.

Введем логистическую функцию

missing image file, (1)

принимающей значения в интервале (0; 1) и выполняющей классификацию наблюдений. Пороговым значением для является missing image file.

Разделяющая линейная граница задается уравнением гиперплоскости missing image file, где missing image file – вектор коэффициентов.

Зададим область D1 возможных значений x для первой группы как missing image file, а для второй группы – как missing image file. Тогда missing image file missing image fileи missing image file missing image file. Если missing image file, то x принадлежит гиперплоскости П, т.е. для произвольного наблюдения x* вероятность его отнесения к первой группе равна missing image file, а ко второй – missing image file. В нашем случае первая группа – это пациенты, находящиеся на ИВЛ (Z = 0), вторая группа – находящиеся на ЕВЛ (Z = 1). Оценивание вектора коэффициентов b было выполнено с помощью алгоритма Ньютона – Рафсона [12, 13].

Представляет интерес также исследование системных свойств каждой из групп пациентов с помощью энтропийного моделирования [14].

Результаты исследования и их обсуждение

Для решения задачи нужно построить решающее правило классификации между двумя группами пациентов «ИВЛ» и «ЕВЛ». Для этого нужно решить задачу многомерной классификации (распознавания) двух групп (кластеров) по показателям X1–X20. Суть решения состоит в нахождении такой совокупности показателей из исходного множества (X1–X20), которая позволила бы статистически достоверно распознать различия в этих группах. Решающее правило классификации получаем с помощью логистической регрессии.

Для обеспечения вычислительной устойчивости выполним стандартизацию исходных данных: для дискретных показателей приведем их значения к нулевому среднему, а для непрерывных – вычтем среднее и поделим на среднее квадратическое отклонение.

Информативными показателями оказались X1, X2, X3, X5, X7, X11, X12, X16–X20. Нормированные значения показателей приведены в табл. 2.

Стандартизация данных состоит в вычитании соответствующего значения a и делении на соответствующее значение b каждого из значений переменных (табл. 3).

Таблица 2

Фактические значения информативных показателей

#

Z

X1

X2

X3

X5

X7

X11

X12

X16

X17

X18

X19

X20

1

0

1,0

-1,99

-0,46

-1,5

1,46

-0,58

-0,40

-0,46

-1,00

-0,04

-1,15

-0,48

2

0

-1,0

-0,47

-0,20

1,5

-0,30

-0,71

-0,07

0,13

-0,14

-1,01

-0,20

1,03

3

0

1,0

1,55

1,24

1,5

-0,67

-0,22

0,63

-0,25

-0,63

-1,07

-0,71

0,02

4

0

-1,0

-0,98

-0,85

1,5

0,14

-0,09

-4,63

-0,49

-0,34

-1,74

-0,50

0,50

5

0

1,0

0,03

1,11

0,0

-0,75

0,62

-0,03

1,20

-0,24

-0,77

0,02

0,22

6

0

1,0

0,03

0,37

0,0

-0,75

-0,96

-0,17

1,58

0,55

0,21

0,50

-0,20

7

0

1,0

-0,47

-0,33

1,5

-0,53

-0,21

-1,85

-0,09

3,86

-0,88

1,29

-0,23

8

0

1,0

-0,47

-1,37

1,5

-0,31

0,17

-0,45

-0,21

-0,89

2,67

1,03

-0,37

9

0

-1,0

-0,47

-0,46

1,5

-0,75

-0,22

0,07

-0,99

0,74

-1,13

0,87

-1,12

10

0

-1,0

1,55

-0,24

1,5

-0,01

-0,16

-0,26

0,67

-0,96

-0,60

0,03

0,12

11

0

-1,0

0,54

0,28

0,0

0,19

-0,64

0,25

0,70

0,25

-0,05

0,24

-0,11

12

0

1,0

0,54

0,28

0,0

0,28

1,13

0,39

0,55

1,04

-0,75

0,50

-0,26

13

0

-1,0

0,03

-0,37

0,0

-0,30

-0,38

-0,31

-0,13

-0,83

0,26

0,34

-0,73

14

0

1,0

-1,99

-1,33

1,5

0,58

-0,17

-1,10

-0,15

-1,04

1,30

-0,97

-0,28

15

0

1,0

1,04

-1,20

1,5

-0,75

-0,33

0,30

1,23

1,76

0,10

0,78

-0,43

16

0

1,0

0,54

1,50

1,5

-0,60

0,87

-0,49

-1,60

0,54

-1,64

1,29

-0,66

17

0

-1,0

1,04

-0,46

1,5

0,21

0,04

-1,15

-0,04

0,65

-0,16

0,91

1,48

18

0

1,0

1,04

1,80

-1,5

-0,16

0,66

0,86

-0,53

0,98

0,10

0,83

0,72

19

0

1,0

0,54

-0,59

1,5

-0,31

-0,67

0,16

0,30

0,27

0,01

0,93

-0,37

20

0

1,0

-1,99

-0,46

1,5

0,65

-0,34

0,77

-0,29

0,97

0,10

-0,16

0,94

21

0

1,0

0,03

-1,63

0,0

-0,97

-0,16

0,63

0,34

-0,22

-1,10

1,03

-0,28

22

0

-1,0

-0,98

0,28

1,5

0,19

5,31

-1,90

-1,36

-0,24

-0,12

-2,00

0,73

23

0

1,0

-0,98

-0,37

0,0

-0,75

2,01

0,35

0,80

-0,41

0,75

0,02

-0,09

24

0

1,0

-0,67

-0,02

1,5

-0,16

0,17

0,11

1,46

-0,94

0,72

0,05

-0,67

25

0

1,0

1,04

-1,55

0,0

-0,16

0,36

0,11

0,92

0,07

0,36

0,48

-0,62

26

0

1,0

-0,67

-0,59

1,5

-0,08

0,17

-0,07

-0,47

-0,99

0,48

-0,09

-0,05

27

0

-1,0

0,33

-0,33

0,0

0,28

-0,42

-0,73

-0,27

-0,81

1,11

-1,01

0,32

28

0

1,0

1,04

-0,50

1,5

4,70

-0,79

0,07

0,57

0,32

-0,42

0,20

-1,29

29

0

1,0

-1,99

-0,76

-1,5

-0,16

-0,36

0,72

0,78

-0,57

1,09

1,11

-1,34

30

0

1,0

0,54

-0,37

1,5

0,19

-0,70

0,16

-0,12

-0,73

-0,29

0,22

-0,80

31

0

-1,0

0,03

-0,20

0,0

2,64

-0,49

0,96

0,43

-0,91

0,61

-1,59

0,60

32

0

1,0

-1,58

-0,59

1,5

0,19

2,36

-0,45

0,35

-1,00

2,07

-3,39

-1,00

33

0

-1,0

0,03

-2,33

1,5

2,64

0,36

0,16

0,47

-1,25

3,07

-2,02

0,45

34

0

1,0

1,04

1,15

-1,5

0,36

1,14

1,10

-0,70

-0,31

-0,52

-0,01

0,57

35

0

1,0

-1,89

-0,81

1,5

-0,89

0,60

-0,35

-0,73

-0,71

-0,22

-0,91

1,40

36

0

-1,0

-1,48

-1,50

1,5

-0,23

0,17

-0,96

-0,09

0,17

0,21

-0,51

-0,88

37

0

1,0

0,33

0,72

1,5

-0,08

0,00

0,30

-0,64

-0,90

0,53

-0,48

0,42

38

0

1,0

0,33

0,37

1,5

-0,45

-0,34

0,25

0,21

-0,95

0,62

-0,41

0,69

39

1

1,0

1,24

1,80

1,5

-0,30

-0,96

0,49

1,30

0,87

0,04

1,21

-1,27

40

1

1,0

1,24

0,46

1,5

-0,67

-1,13

0,81

2,06

-0,25

-0,01

0,36

-0,93

41

1

-1,0

0,33

0,80

1,5

-0,89

-0,23

1,14

-0,29

-0,40

0,45

0,36

-0,07

42

1

-1,0

0,03

1,06

1,5

0,43

-0,90

-0,17

2,68

-0,64

-2,49

-2,32

-0,76

43

1

-1,0

2,05

1,41

1,5

1,46

-0,34

0,81

-0,75

1,27

-1,12

1,77

-1,44

44

1

1,0

-0,37

0,59

1,5

-0,97

-0,70

2,12

0,46

-0,02

0,71

1,49

1,80

45

1

1,0

0,54

1,02

0,0

-0,97

-0,55

0,81

-0,30

0,52

0,25

0,78

-1,01

46

1

-1,0

0,03

1,67

1,5

0,14

-0,47

0,16

-0,30

0,30

-0,58

0,08

0,44

47

1

-1,0

1,04

0,54

1,5

0,19

-0,45

0,81

-1,25

0,35

-0,22

0,64

-1,18

48

1

-1,0

-0,47

-1,07

0,0

-0,16

-0,45

-0,17

-1,11

0,45

0,67

-0,34

-0,50

49

1

-1,0

0,03

1,46

1,5

-0,82

0,33

0,16

-2,42

1,24

-0,05

0,22

2,31

50

1

-1,0

0,03

-0,24

1,5

-0,53

-0,23

-0,49

0,07

2,66

-0,85

-0,06

0,18

51

1

1,0

1,04

1,54

-1,5

-0,16

0,12

-0,49

-2,82

0,64

-0,39

-0,20

0,52

52

1

1,0

1,34

1,93

0,0

-1,11

-0,33

0,81

-0,07

-1,29

-1,13

0,36

-0,59

Таблица 3

Параметры для стандартизации информативных показателей

 

X1

X2

X3

X5

X7

X11

X12

X16

X17

X18

X19

X20

a

0,500

27,969

1035,370

1,000

2,315

3,189

95,755

95,653

19,173

20,722

82,435

31,870

b

0,499

0,990

229,862

0,662

1,359

1,894

1,528

18,409

4,102

1,438

7,090

11,732

Таблица 4

Коэффициенты интегративного прогностического индекса

b0

b1

b2

b3

b5

b7

-27,949

-6,779

-7,499

21,691

0,168

-10,136

b11

b12

b16

b17

b18

b19

b20

-28,237

17,644

-8,560

14,321

11,347

-15,106

-12,766

Решающее правило строится по обучающей выборке. Решающее правило предназначено для классификации состояний новых пациентов с целью оперативного автоматического обнаружения момента перевода пациента с ИВЛ на ЕВЛ. В многомерном пространстве признаков оно имеет вид разделяющей поверхности. Воспользуемся логистической регрессией. Учитывая существенные признаки, был рассчитан интегративный прогностический индекс (ИПИ) по формуле

missing image file (2)

где коэффициенты bj приведены в табл. 4.

Присутствие в прогностическом правиле (2) ряда показателей анамнеза и КОС крови при рождении свидетельствует о том, что они влияют на состояние здоровья пациентов. Также отметим, что в модель (2) не вошли управляющие показатели X1, X2, X3. Их статистическая незначимость может быть объяснена присутствием человеческого фактора.

Прогностическое правило (2) работает так. Если рассчитанный по формуле (2) результат будет меньше нуля, то у ребенка прогнозируется состояние «ИВЛ» с вероятностью missing image file. Если результат W будет больше нуля, то у ребенка прогнозируется состояние «ЕВЛ» с вероятностью missing image file. В табл. 5 приведены результаты классификации пациентов по ИПИ (1). Все пациенты правильно классифицированы.

Таблица 5

Результаты классификации пациентов

 

Pred.

0,000000

Pred.

1,000000

Percent

Correct

Z = 0

38

0

100,0000

Z = 1

0

14

100,0000

Все пациенты правильно классифицированы. Вероятности правильной классификации получились очень высокими, максимальная ошибка составила менее 0,04. Это означает, что классификация выполнена не только верно, но и статистически надежно.

Исследуем полученную математическую модель (2). Введем величину

missing image file, (3)

откуда нетрудно получить, что

missing image file, missing image file.

Приравняем missing image fileи умножим обе части последней формулы на 100 %:

missing image file,

с учетом (3) это означает, что коэффициент bk при переменной Xk показывает, на сколько процентов изменится отношение вероятности отнесения пациента к классу «ЕВЛ» (D2) к вероятности отнесения пациента к классу «ИВЛ» (D1) при увеличении Xk на одну единицу и при фиксированных значениях остальных переменных в (2).

Согласно (3) производная V(x) по Xk прямо пропорциональна коэффициенту bk. Поэтому для увеличения значения h(x) (вероятности отнесения пациента к классу «ЕВЛ») приращения missing image file должны быть положительными (если bk > 0) и отрицательными (если bk < 0): нужно увеличивать значения показателей X12, X17, X18; нужно уменьшать значения показателей X11, X16, X19, X20.

Это позволяет рассматривать задачу управления состоянием конкретного пациента с целью уменьшения времени нахождения его на ИВЛ с учетом его фактических показателей состояния здоровья. Целевой функцией будет вероятность h(x) отнесения пациента к классу «ЕВЛ». При h(x) > 0,5 пациент будет классифицирован как относящийся к классу «ЕВЛ».

Исследуем теперь поведение дифференциальной энтропии в каждой из групп пациентов. Результаты расчета [15] энтропии хаотичности HV, энтропии самоорганизации HR и общая энтропия H для двух групп пациентов приведены в табл. 6.

Таблица 6

Энтропийный анализ для групп «ИВЛ» и «ЕВЛ»

Группа

HV

HR

H

ИВЛ

16,439

-1,640

14,799

ЕВЛ

14,839

-7,967

6,872

Из табл. 6 видим, что энтропия и ее составляющие в группах существенно отличаются. В группе «ЕВЛ» и энтропия хаотичности, и энтропия самоорганизации, и общая энтропия существенно меньше, чем в группе «ИВЛ». Это означает, что перед переходом к неинвазивной дыхательной поддержке у новорожденных происходит резкое уменьшение вариации (дисперсии) показателей и одновременный рост тесноты корреляционной связи между ними. Это позволяет предположить, что добавление к непрерывному мониторингу по правилу (2) энтропийного анализа для каждого из пациентов позволит повысить достоверность и оперативность перехода к неинвазивной дыхательной поддержке пациентов.

Заключение

Описана математическая модель для определения перехода недоношенных новорожденных со сроком гестации менее 30 недель от инвазивной вентиляции легких к неинвазивной дыхательной поддержке. Она основана на бинарной логистической регрессии.

Получено решающее правило для классификации состояний новых пациентов с целью оперативного автоматического обнаружения момента перевода пациента на неинвазивную дыхательную поддержку. Для обучающей выборки из 52 пациентов достоверность классификации составила 100 %.

Проведенный энтропийный анализ обучающей выборки пациентов показал, что перед переходом к неинвазивной дыхательной поддержке у новорожденных происходит резкое уменьшение вариации (дисперсии) показателей и одновременный рост тесноты корреляционной связи между ними.

Работа выполнена при поддержке совместного российско-белорусского проекта РФФИ (грант № 20-51-00001) и БРФФИ (грант № М20Р-008).