Научный журнал
Современные наукоемкие технологии
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,021

РЕАЛИЗАЦИЯ ВЫЧИСЛИТЕЛЬНОГО АЛГОРИТМ МЕТОДА ФОРДИАСИМПТ НА ПРИМЕРЕ АЛЬТЕРНАТИВНЫХ ПОКАЗАТЕЛЕЙ АРТЕРИАЛЬНОЙ ГИПЕРТЕНЗИИ

Гольтяпин В.В. 1
1 ФГБУН «Институт математики им С.Л. Соболева Сибирского отделения Российской академии наук»
1. Чазова И.Е. и др. Диагностика и лечение артериальной гипертензии. – М.: Рекомендации Российского медицинского общества по артериальной гипертонии и Всероссийского научного общества кардиологов. – 2008.
2. Гольтяпин В.В., Шовин В.В. Косоугольная факторная модель артериальной гипертензии первой стадии // Вестник Омского университета. – 2010 – № 4. – С. 120–128
3. Иберла К. Факторный анализ: пер. с нем. В.М. Ивановой. – М.: Статистика, 1980. – С. 397.
4. Harman H. Modern factor analysis. – Chicago, 1967; Русский перевод: Харман Г. Современный факторный анализ. – М.: Статистика, 1972. – С. 483.
5. Осипов Г.В. Методы измерения в социологии. – М.: Наука, 2003.
6. Lazarsfeld P.F. The logical and mathematical foundation of latent structure analysis. – In: Measurement and Prediction. N. Y., 1950.
7. Гольтяпин В.В. Вычислительные аспекты метода минимальных остатков при разрешении варианта Хейвуда // Сибирский журнал индустриальной математики. – 2005. – Т. VII. – № 3(23). – С. 145–151.
8. Kaiser H.F. The varimax criterion for analytic rotation in factor analysis. // Psyhometrika. – 1958. – № 23. – С. 187–200.
9. D. Saunders The rationale for an «oblimax» method of transformation in factor analysis // Psyhometrika. – 1961 – № 26. – С. 317–324.

На сегодняшний день артериальная гипертензия является одной из наиболее значимых медико-социальных проблем Российской Федерации. Артериальная гипертензия – синдром повышенного артериального давления. Гипертоническая болезнь – это хронически протекающее заболевание, основным проявлением которого является артериальная гипертензия, не связанная с наличием патологических процессов. В табл. 1 представлена классификация уровней артериального давления (АД), включающей в себя значения систолического артериального давления (САД) и диастолического артериального давления (ДАД) при артериальной гипертензии и относительной нормы [1–2].

Таблица 1

Классификация уровней артериального давления

Категории артериального давления

   

Оптимальное

< 120

< 80

Нормальное

120–129

< 84

Высокое нормальное

130–139

85–89

Артериальная гипертензия первой степени

140–159

90–99

Артериальная гипертензия второй степени

160–179

100–109

Артериальная гипертензия третьей степени

> 180

> 110

Изолированная систолическая артериальная гипертензия

> 140

< 90

Кровь в организме человека оказывает на стенки кровеносных сосудов давление. Движение крови осуществляется под влиянием разности давлений между различными отделами сосудистого русла, создаваемого сердцем. Давление в артериях в момент, когда сердце сжимается и выталкивает кровь в артерии, определяет систолическое артериальное давление, оно зависит от силы сокращения сердца. Давление в артериях в момент расслабления сердечной мышцы определяет диастолическое артериальное давление. В качестве исходных показателей научного исследования используются альтернативные показатели, вторично характеризующие состояние артериальной гипертензии: приступы стенокардии, одышка, перебои в работе сердца (ПРС), головокружения и (или) обмороки (ГО), головные боли (ГБ), нарушения сна (НС), шум в ушах и (или) в голове (ШУГ). Данные показатели измерялись у лиц преклонного возраста с различной степенью артериальной гипертензии. Объем выборки составил 96 человек.

Построение алгоритма метода и его апробация на выше перечисленных показателях предполагает совместное использование латентной модели и ортогональной факторной структуры в формирование симптомокомплексов и построения диагностической шкалы [3–6]. Прежде чем излагать суть метода необходимо дать определения базовых терминов.

Определение. Диагностической шкалой в методе ФОРДИАСИМПТ называется набор апостериорных вероятностей полученных с помощью простейшей латентно-структурной модели и формулы Байеса, позволяющей отнести объект исследования к одному из двух сформированных классов.

Определение. Симптомокомплексом называется тройка альтернативных показателей, используемых для построения диагностической шкалы в методе ФОРДИАСИМПТ.

Определение. Два симптомокомплекса считаются зависимыми, если они содержат хотя бы один общий параметр, в противном случае эти симптомокомплексы независимы.

Первая задача ФОРДИАСИМПТ – сформировать набор симптомокомплексов опираясь на ортогональную факторную структуру с учетом уровня значимости Ţ φ коэффициента по χ2 критерию. Вторая задача ФОРДИАСИМПТ – для каждого симптомокомплекса найти диагностическую шкалу на базе простейшей латентно-структурной модели.

Первая задача решается посредством классического факторного исследования, но с учетом бинарности исходных показателей [3], [7]. Вторая – непосредственным переходом к построению латентной модели на базе альтернативных данных. Построение латентной модели подразумевает ввод следующих обозначений:

pi – отношение числа лиц, положительно ответивших на i-ый вопрос к общему числу респондентов;

pij – отношение числа лиц, положительно ответивших на i-ый и j-ый вопросы к общему числу респондентов;

gol02.wmf – отношение числа лиц, положительно ответивших на i-ый и отрицательно на j-ый вопросы, к общему числу респондентов;

gol03.wmf – отношение числа лиц, отрицательно ответивших на i-ый и j-ый вопросы к общему числу респондентов;

pijk – отношение числа лиц, положительно ответивших на i-ый, j-ый и k-ый вопросы, к общему числу респондентов;

gol04.wmf – отношение числа лиц, положительно ответивших на i-ый и k-ый вопросы и отрицательно на j-ый, к общему числу респондентов;

gol05.wmf – отношение числа лиц, отрицательно ответивших на i-ый и j-ый вопросы при положительном ответе на k-ый вопрос, к общему числу респондентов;

gol06.wmf – частота, соответствующая относительному объему i-го класса;

gol07.wmf – вероятность положительного ответа респондента на j-ый вопрос, находясь в i-ом классе;

gol08.wmf – вероятность положительного ответа респондента на j-ый и k-ый вопросы, находясь в i-ом классе;

gol10.wmf – вероятность положительного ответа респондента на первый, второй и третий вопросы, находясь в i-ом классе.

Используя вышеуказанные обозначения при построении латентной модели на базе альтернативных показателей при наличии трех вопросов и двух латентных классов, получаем дискретные классы респондентов и разрешимую систему уравнений с дискретными переменными:

gol11.wmf (1)

Для упрощения в целях дальнейшего изложения введем функцию

gol12.wmf,

где l – номер класса и может принимать значение 1 или 2, k – номер симптомокомплекса, gol13.wmf – вероятность положительного ответа респондента из l-ого класса на i-ый вопрос, выбранный как параметр, составляющий симптомокомплекс, yij – значение ответа j-го респондента на i-ый вопрос. Условием вхождения параметров в зависимый или независимый симптомокомплекс является значение весовых нагрузок соответствующего фактора на уровне не ниже 0,5. Вероятность принадлежности первому классу вычисляется посредством формулы Байеса с использованием введенной функции

gol14.wmf (2)

где ak, bk, ck – номера трех параметров k-го симптомокомплекса.

Используя вторичные альтернативные признаки для формирования симптомокомплексов, можно определить при соответствующем знании степени гипертензии, какой тип лечения нужно применять к конкретному пациенту, выбрать тот или иной способ воздействия в зависимости от вероятностной принадлежности пациента к соответствующему симптомокомплексу. А в случае принадлежности индивидуума к нескольким симптомокомплексам с взаимоисключающим лечением подобрать щадящий режим лечения. Нахождение симптомокомплексов осуществлялось нижеследующем алгоритмом метода.

Алгоритм метода ФОРДИАСИМПТ:

1. Из матрицы исходных данных путем элементарного преобразования получаем матрицу стандартизованных данных.

2. Вычисляем корреляционную матрицу.

3. С целью исключения незначимых показателей вычисляем вероятностные значения уровней зависимости по формуле χ2 = n·φ, где n – объем выборки.

4. Определяем наименьшее количество выделяемых факторов (критерий Гуттмана, критерий «каменной осыпи» или другой адекватный критерий [3–4]).

5. Находим общности любым из известных методов [3], [7].

6. Вычисляем первичную ортогональную матрицу весовых нагрузок факторов A (метод главных факторов, метод минимальных остатков и т.д. [2–4]).

7. Полученную на предыдущем шаге матрицу весовых нагрузок подвергаем ортогональному вращению в соответствии с варимакс критерием [4], [8–9].

8. Осуществляем анализ ортогональной факторной структуры, полученной после вращения, и формируем зависимые и независимые симптомокомплексы.

9. Для каждого симптомокомплекса формируем диагностическую шкалу, вычисляя маргиналы и решая систему уравнений (1).

10. По формуле (2) вычисляем апостериорные вероятности для всех объектов исследования.

Таблица 2

Матрица коэффициентов корреляции пациентов с артериальной гипертензией

Стенокардия

Одышка

ПРС

ГО

ГБ

НС

ШУГ

1

0,35

0,393

0,163

0,0237

0,183

-0,0159

0,35

1

0,467

0,54

0,251

0,351

0,147

0,393

0,476

1

0,343

0,233

0,181

0,0687

0,163

0,54

0,343

1

0,564

0,395

0,289

0,0237

0,251

0,233

0,564

1

0,497

0,518

0,183

0,351

0,181

0,395

0,497

1

0,3

-0,0159

0,147

0,0687

0,289

0,518

0,3

1

Таблица 3

Матрица значимости φ коэффициентов по χ2 распределению

Стенокардия

Одышка

ПРС

ГО

ГБ

НС

ШУГ

1

0,999

1

0,890

0,184

0,927

0,124

0,999

1

1

1

0,986

0,999

0,850

1

1

1

0,999

0,978

0,924

0,499

0,890

1

0,999

1

1

1

0,995

0,184

0,986

0,978

1

1

1

1

0,927

0,999

0,924

1

1

1

0,997

0,124

0,850

0,499

0,995

1

0,997

1

Таблица 4

Матрица собственных значений корреляционной матрицы

λ1

λ2

λ3

λ4

λ5

λ6

λ7

2,87

0

0

0

0

0

0

0

1,43

0

0

0

0

0

0

0

0,724

0

0

0

0

0

0

0

0,684

0

0

0

0

0

0

0

0,537

0

0

0

0

0

0

0

0,476

0

0

0

0

0

0

0

0,279

Анализ табл. 4 позволяет сделать предварительную оценку по Гуттману того, что число общих факторов не меньше двух, т.к. имеются два собственных числа корреляционной матрицы больше (или равных) единице. Для оценки сверху количества выделяемых факторов использовался критерий, задаваемый формулой (3), величина которого асимптотически распределена по закону χ2 c числом степеней свободы, равным gol16.wmf:

gol17.wmf (3)

где m – размерность выборки, r – количество выделяемых факторов, A – матрица весовых нагрузок факторов, R – корреляционная матрица, D – диагональная матрица факторного отображения характерных факторов. В нашем примере gol18.wmf, gol19.wmf, v = 15, Um = 1,769678.

Очевидно, что Um не превышает даже высоко статистического уровня значимости, следовательно, выделение только двух факторов обоснованно.

Таблица 5

Матрица ортогонального факторного отображения после варимакс вращения, полученная методом минимальных остатков

 

Фактор № 1

Фактор № 2

Стенокардия

0,543

-0,002

Одышка

-0,707

0,303

ПРС

-0,615

0,172

ГО

-0,418

0,590

ГБ

-0,036

0,923

НС

-0,243

0,525

ШУГ

0,040

0,558

Анализ матрицы весовых нагрузок позволил сформировать один независимый симптомокомплекс («Стенокардия, Одышка, ПРС») и четыре зависимых симптомокомплекса («ГО, ГБ, НС», «ГО, НС, ШУГ», «ГО, ГБ, ШУГ», «ГБ, НС, ШУГ»). Результаты представлены в нижеследующих таблицах.

Таблица 6

Основные показатели симптомокомплекса «Стенокардия, Одышка, ПРС» (№ 1)

Маргиналы

Значения частот и априорных

вероятностей

Варианты ответов

Апостериорная

вероятность

p1 = 0,125

gol20.wmf

1

1

1

0,007

P2 = 0,260

gol21.wmf

1

1

0

0,469

P3 = 0,230

gol22.wmf

1

0

0

0,982

p12 = 0,083

gol23.wmf

0

0

0

0,999

p13 = 0,083

gol24.wmf

0

0

1

0,916

p23 = 0,146

gol25.wmf

0

1

1

0,145

p123 = 0,07

gol26.wmf

1

0

1

0,315

 

gol27.wmf

0

1

0

0,954

Таблица 7

Основные показатели симптомокомплекса «ГО, ГБ, НС» (№ 2)

Маргиналы

Значения частот и априорных

вероятностей

Варианты ответов

Апостериорная

вероятность

p1 = 0,302

gol28.wmf

1

1

1

0,000

p2 = 0,469

gol29.wmf

1

1

0

0,002

p3 = 0,427

gol30.wmf

1

0

0

0,283

p12 = 0,271

gol31.wmf

0

0

0

0,989

p13 = 0,219

gol32.wmf

0

0

1

0,852

p23 = 0,323

gol33.wmf

0

1

1

0,039

p123 = 0,198

gol34.wmf

1

0

1

0,024

 

gol35.wmf

0

1

0

0,395

Таблица 8

Основные показатели симптомокомплекса «ГО, НС, ШУГ» (№ 3)

Маргиналы

Значения частот и априорных

вероятностей

Варианты ответов

Апостериорная

вероятность

p1 = 0,302

gol36.wmf

1

1

1

0,002

p2 = 0,469

gol37.wmf

1

1

0

0,019

p3 = 0,437

gol38.wmf

1

0

0

0,999

p12 = 0,271

gol39.wmf

0

0

0

0,999

p13 = 0,198

gol40.wmf

0

0

1

0,999

p23 = 0,333

gol41.wmf

0

1

1

0,032

p123 = 0,198

gol42.wmf

1

0

1

0,999

 

gol43.wmf

0

1

0

0,248

Таблица 9

Основные показатели симптомокомплекса «ГО, ГБ, ШУГ» (№ 4)

Маргиналы

Значения частот и априорных

вероятностей

Варианты ответов

Апостериорная

вероятность

p1 = 0,302

gol44.wmf

1

1

1

0,999

p2 = 0,427

gol45.wmf

1

1

0

0,989

p3 = 0,437

gol46.wmf

1

0

0

0,800

p12 = 0,219

gol47.wmf

0

0

0

0,048

p13 = 0,198

gol48.wmf

0

0

1

0,287

p23 = 0,260

gol49.wmf

0

1

1

0,905

p123 = 0,146

gol50.wmf

1

0

1

0,969

 

gol51.wmf

0

1

0

0,548

Таблица 10

Основные показатели симптомокомплекса «ГБ, НС, ШУГ» (№ 5)

Маргиналы

Значения частот и априорных

вероятностей

Варианты ответов

Апостериорная

вероятность

p1 = 0,469

gol52.wmf

1

1

1

0,999

p2 = 0,427

gol53.wmf

1

1

0

0,999

p3 = 0,437

gol54.wmf

1

0

0

0,999

p12 = 0,323

gol55.wmf

0

0

0

0,028

p13 = 0,333

gol56.wmf

0

0

1

0,329

p23 = 0,260

gol57.wmf

0

1

1

0,878

p123 = 0,219

gol58.wmf

1

0

1

0,999

 

gol59.wmf

0

1

0

0,300

Сформированные симптомокомплексы позволили выявить соответствующие подгруппы пациентов с артериальной гипертензий, к которым, в зависимости от вероятностной принадлежности к зависимым симптомокомплексам и независимому симптомокомплексу, проведено оптимальное или щадящие лечение. С точки зрения медицины набор зависимых симптомокомплексов отвечает за расстройства центральной системы, а независимый симптомокомплекс в большей степени характеризует нарушения в работе сердца.

Выводы

Реализован вычислительный алгоритм ФОРДИАСИМПТ, позволяющий строить диагностические симптомокомплексы на базе альтернативных данных, оптимальной ортогональной факторной структуры, простейшей латентно-структурной модели и формулы Байеса.

Полученный алгоритм ФОРДИАСИМПТ был апробирован на данных, характеризующих в качестве вторичных показателей состояние пациентов пожилого возраста при артериальной гипертензии. В результате работы алгоритма были выявлены четыре зависимых и один независимый симптомокомплексы, позволяющие подобрать индивидуальное лечение к каждому пациенту на базе вероятностной принадлежности к соответствующему набору симптомокомплексов и с учетом зависимости между ними.


Библиографическая ссылка

Гольтяпин В.В. РЕАЛИЗАЦИЯ ВЫЧИСЛИТЕЛЬНОГО АЛГОРИТМ МЕТОДА ФОРДИАСИМПТ НА ПРИМЕРЕ АЛЬТЕРНАТИВНЫХ ПОКАЗАТЕЛЕЙ АРТЕРИАЛЬНОЙ ГИПЕРТЕНЗИИ // Современные наукоемкие технологии. – 2014. – № 11. – С. 50-55;
URL: http://top-technologies.ru/ru/article/view?id=34775 (дата обращения: 03.12.2020).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074