Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

Введение

В развитии синдрома соединительноткан­ной дисплазии (СТД) принимают участие мно­гие факторы. Как правило, в них задейство­ваны эндогенные и экзогенные механизмы.

Увеличение числа случаев СТД, наблюдающе­еся в настоящее время, связано с патогенны­ми воздействиями в онтогенезе, связанными с ухудшением экологической обстановки. Так же немаловажными факторами являются плохое питание и стрессы.

На сегодняшний день одной из задач совре­менной медицины является исследование дисплазии соединительной ткани. Это состояние, которое зависит от молекулярных, генетически детерминированных дефектов биосинтеза ком­понентов соединительной ткани (каллогена, эластина, фибрина).

В связи с увеличением случаев СТД и, со­ответственно, с возросшей актуальностью дан­ной проблемы, основной целью стала реализа­ция факторной модели средовых воздействий и создание программного комплекса на базе факторизованных методов распознавания образов, решающего диагностическую задачу, посвя­щенную дисплазии соединительной ткани под­ростков. В целях проведения соответствующего научного исследования специалистами была составлена анкета для опроса детей школьного возраста, характеризующая социальный статус индивидуумов с СТД и без него.

Факторизованные методы распознавания образов

Прежде чем приступать к изложению факторизованных методов распознавания образов, сформулируем основные понятия факторного анализа. Одной из основных целей факторного анализа является извлечение на поверхность фактора, который бы наиболее точно позволил воспроизвести наблюдаемые корреляции.

Для любого факторного исследования ис­ходные данные записываются в виде матрицы Y = {у у}, где индекс i = 1, 2, m относится к пе­ременным (показателям), а индекс j = 1, 2, n к объектам (индивидуумам). Если исходные данные распределены по нормальному закону распределения, то имеется возможность про­ведения стандартизации матрицы Y. Тогда для стандартизованных данных имеет место соот­ношение:

элемента матрицы Z, в виде линейной комби­нации нескольких гипотетических переменных, или факторов. Т.е. значение zij может быть вы­ражено в виде линейной комбинации факторов:

 

где ajr  это весовые нагрузки факторов, а f2]  frj факторные значения факторов у го ин­дивидуума. Равенство (2) выражает основную модель факторного анализа.

Отдельные наблюдаемые значения явля­ются линейными комбинациями гипотети­ческих, ненаблюдаемых, или скрытых пере­менных, называемых факторами, которые не могут быть обнаружены в процессе наблюде­ния. Матрица Z представляет собой произве­дение двух матриц A и F. При этом матрица A отражает связи переменных с факторами, а F описывает отдельные индивидуумы. Если предполагается отсутствие корреляции между факторами, то, подставив формулу (2) в фор­мулу (1), получаем фундаментальную теоре­му факторного анализа для ортогональных факторов:

Фундаментальная теорема утверждает, что корреляционная матрица может быть воспроиз­ведена с помощью факторного отображения и корреляций между факторами [1].

В методе главных факторов в формуле (3) ис­пользуется редуцированная матрица Rh. По диаго­нали этой матрицы стоят общности, которые были найдены методом минимальных остатков [2].

Метод главных факторов заключается в по­иске главных компонент редуцированной кор­реляционной матрицы. Проблема сводится к классической задаче нахождения собственных значений и собственных векторов симметриче­ской матрицы [3, 4, 5].

Матрицу весовых нагрузок факторов будем находить по следующей формуле:

где U и Л  матрицы собственных векторов и собственных значений матрицы Rh соответ­ственно [6].

Далее возникает проблема количества вы­деляемых факторов, которую можно решать различными методами. В данной работе был ис­пользован метод, основанный на критерии «ка­менистой осыпи» [1].

Найденные матрицы весовых нагрузок фак­торов для каждого факторного пространства, позволяют реализовать подходящие методы рас­познавания образов в этих пространствах.

Для построения алгоритмов распознавания используются вероятностные методы распоз­навания, основанные на теории статистических решений. В общем случае применение вероят­ностных методов распознавания предусматри­вает наличие вероятностных зависимостей меж­ду признаками распознаваемых объектов и классами, к которым эти объекты относятся [7]. В данном случае используется следующее веро­ятностное решение:

Поскольку в факторном пространстве однородные факторные значения не превы­шают трех, то достаточно проверить, по­падают ли вычисленные факторные значения объекта исследования в интервал [3; 3]. В этом случае исследуемый объект относится к данному факторному пространству с боль­шей долей вероятности.

При этом факторные значения высчитываются по следующей формуле:

где Л  диагональная матрица собственных зна­чений матрицы R [8].

В качестве меры близости в детерминиро­ванных системах распознавания часто исполь­зуется среднеквадратичное расстояние между данным объектом и совокупностью объектов

[7]. Так как данное факторное пространство имеет форму сферы с центром в точке ноль, то расстояние до центра рассчитывалось как корень из суммы квадратов факторных значе­ний го индивидуума в ]м факторном про­странстве:


где dij - эвклидово расстояние i-го индивидуума в j-м факторном пространстве, а f(j)ki есть k-факторное значение i-го индивидуума в
j-м факторном пространстве. В данном случае используется следующее вероятностное решение:

Исследуемый объект относится к тому факторному пространству с большей долей вероятности, до которого факторизованное расстояние, вычисляемое по формуле (6), меньше.

Алгоритмы факторизованных методов распознавания образов

Алгоритм нахождения матрицы факторных значений

1.  Формирование таблицы с ответами ре­спондентов.

2.  Преобразование ответов респондентов в шкалы по типу «обратных школьных оценок».

3.  Ранжирование данных.

4.  Стандартизация исходных данных.

5.  Вычисление корреляционной матрицы по формуле (1).

6.  Нахождение матрицы весовых нагрузок по формуле (4).

Алгоритм реализации факторизованных методов распознавания образов для качественных показателей

1.  Формирование объекта исследования:

  1. создается вектор ответов для исследуемо­го объекта по установленной таблице опросов;
  2. выбирается соответствие имеющихся от­ветов с базой шкалированных и ранжированных данных;
  3. формируется вектор ранжированных дан­ных конкретного объекта;
  4. осуществляется стандартизация ранжи­рованного вектора.

2.  Вычисление факторных значений по фор­муле (5).

3.  Проверка вложенности факторных значе­ний соответствующего объекта в [3; 3].

4.  Расчет факторизованных эвклидовых рас­стояний по формуле (6) .

5.  Принятие решения на базе соответствую­щих вероятностных правил.

Результаты и выводы

Программная реализация вышеописанных алгоритмов позволила создать диагностикоисследовательский программный комплекс, осно­ванный на факторизованных методах распозна­вания, и провести факторное исследование.

В результате проведенного факторного ис­следования выделены следующие факторы: загрязнения атмосферного воздуха промыш­ленными предприятиями и автотранспортом, радиационное и нерадиационное излучение, бытовые интоксикации, бытовые вредности, эпидермальная вредность, личностный фактор, факторы реализации, фактор превентивный по отношению к СТД. У пациентов с СТД оказа­лись значимыми факторы окружающей среды обитания, которые оказали неблагоприятное воздействие на состояние их здоровья.

Полученные данные позволяют говорить о том, что все лица молодого возраста имеют отклонения в состоянии здоровья, связанные с воздействием неблагоприятных факторов окру­жающей среды обитания.

Данные изменения носят однонаправлен­ный, но неоднозначный характер в исследова­нии групп. У лиц с СТД, по сравнению со здо­ровыми, значимых неблагоприятных факторов больше, чем в контрольной группе. И характер их воздействия затрагивает среду обитания как дома, так и в учебном процессе. 

СПИСОК ЛИТЕРАТУРЫ

1.  Иберла К. Факторный анализ / Иберла К.; пер. с нем. В.М. Ивановой.  М.: Статистика, 1980.  397 с.

2.  Гольтяпин В.В. Вычислительные аспек­ты метода минимальных остатков при разре­шении варианта Хейвуда // Сибирский журнал индустриальной математики.  2005.  Т. VIII, №3 (23).  С. 121129.

3.  Thurstone L.L. Multiple factor analysis / L.L. Thurstone // 6th. ed.  Chicago, 1961.

4.  Zurmuhl R. Matrizen und ihre technischen Anwendungen / R. Zurmuhl. Berlin, 1964.

5.  Wilkinson J.H. The algebraic eigenvalue problem / J.H. Wilkinson.  Oxford, 1965; Русский пер. Дж. Х. Уилкинсон Алгебраическая пробле­ма собственных значений / Дж. Х. Уилкинсон. М.: Наука, 1970.  565 с.

6.  Harman H. Modern factor analysis. / H. Harman.  Chicago, 1967; Русский пер. Г. Хар­ман Современный факторный анализ / Г. Хар­ман.  М.: Статистика, 1972.  483 с.

7.  Горелик А. Л. Методы распознавания, из­дание второе, переработанное и дополненное / А.Л. Горелик, В.А. Скрипкин.  М.: Высшая школа, 1984.  208 с.

8. Гольтяпин В.В. Использование свойств ортогональности факторов в вероятностной задаче распознавания // Сибирский журнал
индустриальной математики.  2007.  Т. Х, №2 (30).  С. 5363.