Введение
В развитии синдрома соединительнотканной дисплазии (СТД) принимают участие многие факторы. Как правило, в них задействованы эндогенные и экзогенные механизмы.Увеличение числа случаев СТД, наблюдающееся в настоящее время, связано с патогенными воздействиями в онтогенезе, связанными с ухудшением экологической обстановки. Так же немаловажными факторами являются плохое питание и стрессы.
На сегодняшний день одной из задач современной медицины является исследование дисплазии соединительной ткани. Это состояние, которое зависит от молекулярных, генетически детерминированных дефектов биосинтеза компонентов соединительной ткани (каллогена, эластина, фибрина).
В связи с увеличением случаев СТД и, соответственно, с возросшей актуальностью данной проблемы, основной целью стала реализация факторной модели средовых воздействий и создание программного комплекса на базе факторизованных методов распознавания образов, решающего диагностическую задачу, посвященную дисплазии соединительной ткани подростков. В целях проведения соответствующего научного исследования специалистами была составлена анкета для опроса детей школьного возраста, характеризующая социальный статус индивидуумов с СТД и без него.
Факторизованные методы распознавания образов
Прежде чем приступать к изложению факторизованных методов распознавания образов, сформулируем основные понятия факторного анализа. Одной из основных целей факторного анализа является извлечение на поверхность фактора, который бы наиболее точно позволил воспроизвести наблюдаемые корреляции.
Для любого факторного исследования исходные данные записываются в виде матрицы Y = {у у}, где индекс i = 1, 2, m относится к переменным (показателям), а индекс j = 1, 2, n к объектам (индивидуумам). Если исходные данные распределены по нормальному закону распределения, то имеется возможность проведения стандартизации матрицы Y. Тогда для стандартизованных данных имеет место соотношение:
элемента матрицы Z, в виде линейной комбинации нескольких гипотетических переменных, или факторов. Т.е. значение zij может быть выражено в виде линейной комбинации факторов:
где ajr это весовые нагрузки факторов, а f2] frj факторные значения факторов у го индивидуума. Равенство (2) выражает основную модель факторного анализа.
Отдельные наблюдаемые значения являются линейными комбинациями гипотетических, ненаблюдаемых, или скрытых переменных, называемых факторами, которые не могут быть обнаружены в процессе наблюдения. Матрица Z представляет собой произведение двух матриц A и F. При этом матрица A отражает связи переменных с факторами, а F описывает отдельные индивидуумы. Если предполагается отсутствие корреляции между факторами, то, подставив формулу (2) в формулу (1), получаем фундаментальную теорему факторного анализа для ортогональных факторов:
Фундаментальная теорема утверждает, что корреляционная матрица может быть воспроизведена с помощью факторного отображения и корреляций между факторами [1].
В методе главных факторов в формуле (3) используется редуцированная матрица Rh. По диагонали этой матрицы стоят общности, которые были найдены методом минимальных остатков [2].
Метод главных факторов заключается в поиске главных компонент редуцированной корреляционной матрицы. Проблема сводится к классической задаче нахождения собственных значений и собственных векторов симметрической матрицы [3, 4, 5].
Матрицу весовых нагрузок факторов будем находить по следующей формуле:
где U и Л матрицы собственных векторов и собственных значений матрицы Rh соответственно [6].
Далее возникает проблема количества выделяемых факторов, которую можно решать различными методами. В данной работе был использован метод, основанный на критерии «каменистой осыпи» [1].
Найденные матрицы весовых нагрузок факторов для каждого факторного пространства, позволяют реализовать подходящие методы распознавания образов в этих пространствах.
Для построения алгоритмов распознавания используются вероятностные методы распознавания, основанные на теории статистических решений. В общем случае применение вероятностных методов распознавания предусматривает наличие вероятностных зависимостей между признаками распознаваемых объектов и классами, к которым эти объекты относятся [7]. В данном случае используется следующее вероятностное решение:
Поскольку в факторном пространстве однородные факторные значения не превышают трех, то достаточно проверить, попадают ли вычисленные факторные значения объекта исследования в интервал [3; 3]. В этом случае исследуемый объект относится к данному факторному пространству с большей долей вероятности.
При этом факторные значения высчитываются по следующей формуле:
где Л диагональная матрица собственных значений матрицы R [8].
В качестве меры близости в детерминированных системах распознавания часто используется среднеквадратичное расстояние между данным объектом и совокупностью объектов
[7]. Так как данное факторное пространство имеет форму сферы с центром в точке ноль, то расстояние до центра рассчитывалось как корень из суммы квадратов факторных значений го индивидуума в ]м факторном пространстве:
где dij - эвклидово расстояние i-го индивидуума в j-м факторном пространстве, а f(j)ki есть k-факторное значение i-го индивидуума в
j-м факторном пространстве. В данном случае используется следующее вероятностное решение:
Алгоритмы факторизованных методов распознавания образов
Алгоритм нахождения матрицы факторных значений
1. Формирование таблицы с ответами респондентов.
2. Преобразование ответов респондентов в шкалы по типу «обратных школьных оценок».
3. Ранжирование данных.
4. Стандартизация исходных данных.
5. Вычисление корреляционной матрицы по формуле (1).
6. Нахождение матрицы весовых нагрузок по формуле (4).
Алгоритм реализации факторизованных методов распознавания образов для качественных показателей
1. Формирование объекта исследования:
- создается вектор ответов для исследуемого объекта по установленной таблице опросов;
- выбирается соответствие имеющихся ответов с базой шкалированных и ранжированных данных;
- формируется вектор ранжированных данных конкретного объекта;
- осуществляется стандартизация ранжированного вектора.
2. Вычисление факторных значений по формуле (5).
3. Проверка вложенности факторных значений соответствующего объекта в [3; 3].
4. Расчет факторизованных эвклидовых расстояний по формуле (6) .
5. Принятие решения на базе соответствующих вероятностных правил.
Результаты и выводы
Программная реализация вышеописанных алгоритмов позволила создать диагностикоисследовательский программный комплекс, основанный на факторизованных методах распознавания, и провести факторное исследование.
В результате проведенного факторного исследования выделены следующие факторы: загрязнения атмосферного воздуха промышленными предприятиями и автотранспортом, радиационное и нерадиационное излучение, бытовые интоксикации, бытовые вредности, эпидермальная вредность, личностный фактор, факторы реализации, фактор превентивный по отношению к СТД. У пациентов с СТД оказались значимыми факторы окружающей среды обитания, которые оказали неблагоприятное воздействие на состояние их здоровья.
Полученные данные позволяют говорить о том, что все лица молодого возраста имеют отклонения в состоянии здоровья, связанные с воздействием неблагоприятных факторов окружающей среды обитания.
Данные изменения носят однонаправленный, но неоднозначный характер в исследовании групп. У лиц с СТД, по сравнению со здоровыми, значимых неблагоприятных факторов больше, чем в контрольной группе. И характер их воздействия затрагивает среду обитания как дома, так и в учебном процессе.
СПИСОК ЛИТЕРАТУРЫ
1. Иберла К. Факторный анализ / Иберла К.; пер. с нем. В.М. Ивановой. М.: Статистика, 1980. 397 с.
2. Гольтяпин В.В. Вычислительные аспекты метода минимальных остатков при разрешении варианта Хейвуда // Сибирский журнал индустриальной математики. 2005. Т. VIII, №3 (23). С. 121129.
3. Thurstone L.L. Multiple factor analysis / L.L. Thurstone // 6th. ed. Chicago, 1961.
4. Zurmuhl R. Matrizen und ihre technischen Anwendungen / R. Zurmuhl. Berlin, 1964.
5. Wilkinson J.H. The algebraic eigenvalue problem / J.H. Wilkinson. Oxford, 1965; Русский пер. Дж. Х. Уилкинсон Алгебраическая проблема собственных значений / Дж. Х. Уилкинсон. М.: Наука, 1970. 565 с.
6. Harman H. Modern factor analysis. / H. Harman. Chicago, 1967; Русский пер. Г. Харман Современный факторный анализ / Г. Харман. М.: Статистика, 1972. 483 с.
7. Горелик А. Л. Методы распознавания, издание второе, переработанное и дополненное / А.Л. Горелик, В.А. Скрипкин. М.: Высшая школа, 1984. 208 с.
8. Гольтяпин В.В. Использование свойств ортогональности факторов в вероятностной задаче распознавания // Сибирский журнал
индустриальной математики. 2007. Т. Х, №2 (30). С. 5363.
Библиографическая ссылка
Глотов А.В., Гольтяпин В.В., Лобачев А.И. ФАКТОРИЗОВАННЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ ОБРАЗОВ В КОМПЬЮТЕРНОЙ ДИАГНОСТИКЕ ДИСПААЗИИ СОЕДИНИТЕЛЬНОЙ ТКАНИ // Современные наукоемкие технологии. – 2010. – № 11. – С. 94-96;URL: https://top-technologies.ru/ru/article/view?id=26133 (дата обращения: 21.11.2024).