На сегодняшний день артериальная гипертензия является одной из наиболее значимых медико-социальных проблем Российской Федерации. Артериальная гипертензия – синдром повышенного артериального давления. Гипертоническая болезнь – это хронически протекающее заболевание, основным проявлением которого является артериальная гипертензия, не связанная с наличием патологических процессов. В табл. 1 представлена классификация уровней артериального давления (АД), включающей в себя значения систолического артериального давления (САД) и диастолического артериального давления (ДАД) при артериальной гипертензии и относительной нормы [1–2].
Таблица 1
Классификация уровней артериального давления
Категории артериального давления |
||
Оптимальное |
< 120 |
< 80 |
Нормальное |
120–129 |
< 84 |
Высокое нормальное |
130–139 |
85–89 |
Артериальная гипертензия первой степени |
140–159 |
90–99 |
Артериальная гипертензия второй степени |
160–179 |
100–109 |
Артериальная гипертензия третьей степени |
> 180 |
> 110 |
Изолированная систолическая артериальная гипертензия |
> 140 |
< 90 |
Кровь в организме человека оказывает на стенки кровеносных сосудов давление. Движение крови осуществляется под влиянием разности давлений между различными отделами сосудистого русла, создаваемого сердцем. Давление в артериях в момент, когда сердце сжимается и выталкивает кровь в артерии, определяет систолическое артериальное давление, оно зависит от силы сокращения сердца. Давление в артериях в момент расслабления сердечной мышцы определяет диастолическое артериальное давление. В качестве исходных показателей научного исследования используются альтернативные показатели, вторично характеризующие состояние артериальной гипертензии: приступы стенокардии, одышка, перебои в работе сердца (ПРС), головокружения и (или) обмороки (ГО), головные боли (ГБ), нарушения сна (НС), шум в ушах и (или) в голове (ШУГ). Данные показатели измерялись у лиц преклонного возраста с различной степенью артериальной гипертензии. Объем выборки составил 96 человек.
Построение алгоритма метода и его апробация на выше перечисленных показателях предполагает совместное использование латентной модели и ортогональной факторной структуры в формирование симптомокомплексов и построения диагностической шкалы [3–6]. Прежде чем излагать суть метода необходимо дать определения базовых терминов.
Определение. Диагностической шкалой в методе ФОРДИАСИМПТ называется набор апостериорных вероятностей полученных с помощью простейшей латентно-структурной модели и формулы Байеса, позволяющей отнести объект исследования к одному из двух сформированных классов.
Определение. Симптомокомплексом называется тройка альтернативных показателей, используемых для построения диагностической шкалы в методе ФОРДИАСИМПТ.
Определение. Два симптомокомплекса считаются зависимыми, если они содержат хотя бы один общий параметр, в противном случае эти симптомокомплексы независимы.
Первая задача ФОРДИАСИМПТ – сформировать набор симптомокомплексов опираясь на ортогональную факторную структуру с учетом уровня значимости Ţ φ коэффициента по χ2 критерию. Вторая задача ФОРДИАСИМПТ – для каждого симптомокомплекса найти диагностическую шкалу на базе простейшей латентно-структурной модели.
Первая задача решается посредством классического факторного исследования, но с учетом бинарности исходных показателей [3], [7]. Вторая – непосредственным переходом к построению латентной модели на базе альтернативных данных. Построение латентной модели подразумевает ввод следующих обозначений:
pi – отношение числа лиц, положительно ответивших на i-ый вопрос к общему числу респондентов;
pij – отношение числа лиц, положительно ответивших на i-ый и j-ый вопросы к общему числу респондентов;
– отношение числа лиц, положительно ответивших на i-ый и отрицательно на j-ый вопросы, к общему числу респондентов;
– отношение числа лиц, отрицательно ответивших на i-ый и j-ый вопросы к общему числу респондентов;
pijk – отношение числа лиц, положительно ответивших на i-ый, j-ый и k-ый вопросы, к общему числу респондентов;
– отношение числа лиц, положительно ответивших на i-ый и k-ый вопросы и отрицательно на j-ый, к общему числу респондентов;
– отношение числа лиц, отрицательно ответивших на i-ый и j-ый вопросы при положительном ответе на k-ый вопрос, к общему числу респондентов;
– частота, соответствующая относительному объему i-го класса;
– вероятность положительного ответа респондента на j-ый вопрос, находясь в i-ом классе;
– вероятность положительного ответа респондента на j-ый и k-ый вопросы, находясь в i-ом классе;
– вероятность положительного ответа респондента на первый, второй и третий вопросы, находясь в i-ом классе.
Используя вышеуказанные обозначения при построении латентной модели на базе альтернативных показателей при наличии трех вопросов и двух латентных классов, получаем дискретные классы респондентов и разрешимую систему уравнений с дискретными переменными:
(1)
Для упрощения в целях дальнейшего изложения введем функцию
,
где l – номер класса и может принимать значение 1 или 2, k – номер симптомокомплекса, – вероятность положительного ответа респондента из l-ого класса на i-ый вопрос, выбранный как параметр, составляющий симптомокомплекс, yij – значение ответа j-го респондента на i-ый вопрос. Условием вхождения параметров в зависимый или независимый симптомокомплекс является значение весовых нагрузок соответствующего фактора на уровне не ниже 0,5. Вероятность принадлежности первому классу вычисляется посредством формулы Байеса с использованием введенной функции
(2)
где ak, bk, ck – номера трех параметров k-го симптомокомплекса.
Используя вторичные альтернативные признаки для формирования симптомокомплексов, можно определить при соответствующем знании степени гипертензии, какой тип лечения нужно применять к конкретному пациенту, выбрать тот или иной способ воздействия в зависимости от вероятностной принадлежности пациента к соответствующему симптомокомплексу. А в случае принадлежности индивидуума к нескольким симптомокомплексам с взаимоисключающим лечением подобрать щадящий режим лечения. Нахождение симптомокомплексов осуществлялось нижеследующем алгоритмом метода.
Алгоритм метода ФОРДИАСИМПТ:
1. Из матрицы исходных данных путем элементарного преобразования получаем матрицу стандартизованных данных.
2. Вычисляем корреляционную матрицу.
3. С целью исключения незначимых показателей вычисляем вероятностные значения уровней зависимости по формуле χ2 = n·φ, где n – объем выборки.
4. Определяем наименьшее количество выделяемых факторов (критерий Гуттмана, критерий «каменной осыпи» или другой адекватный критерий [3–4]).
5. Находим общности любым из известных методов [3], [7].
6. Вычисляем первичную ортогональную матрицу весовых нагрузок факторов A (метод главных факторов, метод минимальных остатков и т.д. [2–4]).
7. Полученную на предыдущем шаге матрицу весовых нагрузок подвергаем ортогональному вращению в соответствии с варимакс критерием [4], [8–9].
8. Осуществляем анализ ортогональной факторной структуры, полученной после вращения, и формируем зависимые и независимые симптомокомплексы.
9. Для каждого симптомокомплекса формируем диагностическую шкалу, вычисляя маргиналы и решая систему уравнений (1).
10. По формуле (2) вычисляем апостериорные вероятности для всех объектов исследования.
Таблица 2
Матрица коэффициентов корреляции пациентов с артериальной гипертензией
Стенокардия |
Одышка |
ПРС |
ГО |
ГБ |
НС |
ШУГ |
1 |
0,35 |
0,393 |
0,163 |
0,0237 |
0,183 |
-0,0159 |
0,35 |
1 |
0,467 |
0,54 |
0,251 |
0,351 |
0,147 |
0,393 |
0,476 |
1 |
0,343 |
0,233 |
0,181 |
0,0687 |
0,163 |
0,54 |
0,343 |
1 |
0,564 |
0,395 |
0,289 |
0,0237 |
0,251 |
0,233 |
0,564 |
1 |
0,497 |
0,518 |
0,183 |
0,351 |
0,181 |
0,395 |
0,497 |
1 |
0,3 |
-0,0159 |
0,147 |
0,0687 |
0,289 |
0,518 |
0,3 |
1 |
Таблица 3
Матрица значимости φ коэффициентов по χ2 распределению
Стенокардия |
Одышка |
ПРС |
ГО |
ГБ |
НС |
ШУГ |
1 |
0,999 |
1 |
0,890 |
0,184 |
0,927 |
0,124 |
0,999 |
1 |
1 |
1 |
0,986 |
0,999 |
0,850 |
1 |
1 |
1 |
0,999 |
0,978 |
0,924 |
0,499 |
0,890 |
1 |
0,999 |
1 |
1 |
1 |
0,995 |
0,184 |
0,986 |
0,978 |
1 |
1 |
1 |
1 |
0,927 |
0,999 |
0,924 |
1 |
1 |
1 |
0,997 |
0,124 |
0,850 |
0,499 |
0,995 |
1 |
0,997 |
1 |
Таблица 4
Матрица собственных значений корреляционной матрицы
λ1 |
λ2 |
λ3 |
λ4 |
λ5 |
λ6 |
λ7 |
2,87 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1,43 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0,724 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0,684 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0,537 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0,476 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0,279 |
Анализ табл. 4 позволяет сделать предварительную оценку по Гуттману того, что число общих факторов не меньше двух, т.к. имеются два собственных числа корреляционной матрицы больше (или равных) единице. Для оценки сверху количества выделяемых факторов использовался критерий, задаваемый формулой (3), величина которого асимптотически распределена по закону χ2 c числом степеней свободы, равным :
(3)
где m – размерность выборки, r – количество выделяемых факторов, A – матрица весовых нагрузок факторов, R – корреляционная матрица, D – диагональная матрица факторного отображения характерных факторов. В нашем примере , , v = 15, Um = 1,769678.
Очевидно, что Um не превышает даже высоко статистического уровня значимости, следовательно, выделение только двух факторов обоснованно.
Таблица 5
Матрица ортогонального факторного отображения после варимакс вращения, полученная методом минимальных остатков
Фактор № 1 |
Фактор № 2 |
|
Стенокардия |
0,543 |
-0,002 |
Одышка |
-0,707 |
0,303 |
ПРС |
-0,615 |
0,172 |
ГО |
-0,418 |
0,590 |
ГБ |
-0,036 |
0,923 |
НС |
-0,243 |
0,525 |
ШУГ |
0,040 |
0,558 |
Анализ матрицы весовых нагрузок позволил сформировать один независимый симптомокомплекс («Стенокардия, Одышка, ПРС») и четыре зависимых симптомокомплекса («ГО, ГБ, НС», «ГО, НС, ШУГ», «ГО, ГБ, ШУГ», «ГБ, НС, ШУГ»). Результаты представлены в нижеследующих таблицах.
Таблица 6
Основные показатели симптомокомплекса «Стенокардия, Одышка, ПРС» (№ 1)
Маргиналы |
Значения частот и априорных вероятностей |
Варианты ответов |
Апостериорная вероятность |
||
p1 = 0,125 |
|
1 |
1 |
1 |
0,007 |
P2 = 0,260 |
|
1 |
1 |
0 |
0,469 |
P3 = 0,230 |
|
1 |
0 |
0 |
0,982 |
p12 = 0,083 |
|
0 |
0 |
0 |
0,999 |
p13 = 0,083 |
|
0 |
0 |
1 |
0,916 |
p23 = 0,146 |
|
0 |
1 |
1 |
0,145 |
p123 = 0,07 |
|
1 |
0 |
1 |
0,315 |
|
0 |
1 |
0 |
0,954 |
Таблица 7
Основные показатели симптомокомплекса «ГО, ГБ, НС» (№ 2)
Маргиналы |
Значения частот и априорных вероятностей |
Варианты ответов |
Апостериорная вероятность |
||
p1 = 0,302 |
|
1 |
1 |
1 |
0,000 |
p2 = 0,469 |
|
1 |
1 |
0 |
0,002 |
p3 = 0,427 |
|
1 |
0 |
0 |
0,283 |
p12 = 0,271 |
|
0 |
0 |
0 |
0,989 |
p13 = 0,219 |
|
0 |
0 |
1 |
0,852 |
p23 = 0,323 |
|
0 |
1 |
1 |
0,039 |
p123 = 0,198 |
|
1 |
0 |
1 |
0,024 |
|
0 |
1 |
0 |
0,395 |
Таблица 8
Основные показатели симптомокомплекса «ГО, НС, ШУГ» (№ 3)
Маргиналы |
Значения частот и априорных вероятностей |
Варианты ответов |
Апостериорная вероятность |
||
p1 = 0,302 |
|
1 |
1 |
1 |
0,002 |
p2 = 0,469 |
|
1 |
1 |
0 |
0,019 |
p3 = 0,437 |
|
1 |
0 |
0 |
0,999 |
p12 = 0,271 |
|
0 |
0 |
0 |
0,999 |
p13 = 0,198 |
|
0 |
0 |
1 |
0,999 |
p23 = 0,333 |
|
0 |
1 |
1 |
0,032 |
p123 = 0,198 |
|
1 |
0 |
1 |
0,999 |
|
0 |
1 |
0 |
0,248 |
Таблица 9
Основные показатели симптомокомплекса «ГО, ГБ, ШУГ» (№ 4)
Маргиналы |
Значения частот и априорных вероятностей |
Варианты ответов |
Апостериорная вероятность |
||
p1 = 0,302 |
|
1 |
1 |
1 |
0,999 |
p2 = 0,427 |
|
1 |
1 |
0 |
0,989 |
p3 = 0,437 |
|
1 |
0 |
0 |
0,800 |
p12 = 0,219 |
|
0 |
0 |
0 |
0,048 |
p13 = 0,198 |
|
0 |
0 |
1 |
0,287 |
p23 = 0,260 |
|
0 |
1 |
1 |
0,905 |
p123 = 0,146 |
|
1 |
0 |
1 |
0,969 |
|
0 |
1 |
0 |
0,548 |
Таблица 10
Основные показатели симптомокомплекса «ГБ, НС, ШУГ» (№ 5)
Маргиналы |
Значения частот и априорных вероятностей |
Варианты ответов |
Апостериорная вероятность |
||
p1 = 0,469 |
|
1 |
1 |
1 |
0,999 |
p2 = 0,427 |
|
1 |
1 |
0 |
0,999 |
p3 = 0,437 |
|
1 |
0 |
0 |
0,999 |
p12 = 0,323 |
|
0 |
0 |
0 |
0,028 |
p13 = 0,333 |
|
0 |
0 |
1 |
0,329 |
p23 = 0,260 |
|
0 |
1 |
1 |
0,878 |
p123 = 0,219 |
|
1 |
0 |
1 |
0,999 |
|
0 |
1 |
0 |
0,300 |
Сформированные симптомокомплексы позволили выявить соответствующие подгруппы пациентов с артериальной гипертензий, к которым, в зависимости от вероятностной принадлежности к зависимым симптомокомплексам и независимому симптомокомплексу, проведено оптимальное или щадящие лечение. С точки зрения медицины набор зависимых симптомокомплексов отвечает за расстройства центральной системы, а независимый симптомокомплекс в большей степени характеризует нарушения в работе сердца.
Выводы
Реализован вычислительный алгоритм ФОРДИАСИМПТ, позволяющий строить диагностические симптомокомплексы на базе альтернативных данных, оптимальной ортогональной факторной структуры, простейшей латентно-структурной модели и формулы Байеса.
Полученный алгоритм ФОРДИАСИМПТ был апробирован на данных, характеризующих в качестве вторичных показателей состояние пациентов пожилого возраста при артериальной гипертензии. В результате работы алгоритма были выявлены четыре зависимых и один независимый симптомокомплексы, позволяющие подобрать индивидуальное лечение к каждому пациенту на базе вероятностной принадлежности к соответствующему набору симптомокомплексов и с учетом зависимости между ними.