Научный журнал
Современные наукоемкие технологии
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,279

ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ АНСАМБЛЕЙ АЛГОРИТМОВ НА ПРИМЕРЕ КЛАССИФИКАЦИИ ПАТОЛОГИЙ СЕРДЦА ПО ОГРАНИЧЕННОЙ ВЫБОРКЕ ПЕРВИЧНЫХ ДАННЫХ

Николаева С.М. 1 Колесникова С.И. 1
1 Федеральное государственное автономное образовательное учреждение высшего образования «Санкт-Петербургский государственный университет аэрокосмического приборостроения»
Николаева С.М. - работа с данными, анализ данных, проведение исследования, предоставление ресурсов, разработка программного обеспечения, валидация результатов, визуализация результатов, написание черновика рукописи
Колесникова С.И. - разработка концепции, методология исследования, научное руководство, написание рукописи – рецензирование и редактирование
Цель исследования – формализация постановки и сравнительное решение прикладной задачи диагностики аритмий с различными подвидами и синусового ритма как нормы по данным электрокардиограмм на основе трех наиболее популярных алгоритмов машинного обучения и ансамблей алгоритмов, сконструированных на их основе. Для проведения сравнительного численного моделирования алгоритмических ансамблей с целью повышения надежности выносимых решений использовались данные с открытым доступом ограниченного объема. В качестве параметров оптимизации ансамблевых алгоритмов применялись классические метрики качества машинного обучения и длительность обучения для вынесения итогового классификационного решения. Представлены результаты численного моделирования на первичных данных измерений для четырех классов в трех условиях – с неравномерным распределением объектов (фрагментов временных рядов), в сбалансированной и аугментированной выборке. На множестве алгоритмов ближайших соседей, опорных векторов и наивного байесовского классификатора показано преимущество ансамблевых алгоритмов перед отдельными базовыми алгоритмами. Достоверность полученных результатов ограничена рассматриваемой выборкой данных. Результаты исследования могут быть полезны для дальнейшего совершенствования коллективных решений и формирования метамодели коллектива алгоритмов, обучающейся на разнотипных данных (картинки фазовых портретов, учет правил динамического перехода между аттрактивными областями, текстовым описанием в рамках онтологической модели и др.).
методы машинного обучения
классификация патологий сердца
метрики качества
аритмия
электрокардиограмма
аугментация выборки
ансамбль алгоритмов
1. Azmi J., Arif M., Nafis M.T., Alam M.A., Tanweer S., Wang G. A systematic review on machine learning approaches for cardiovascular disease prediction using medical big data // Medical Engineering and Physics. 2022. Vol. 105. P. 103825. URL: https://www.sciencedirect.com/science/article/abs/pii/S1350453322000741?via%3Dihub (дата обращения: 29.09.2025). DOI: 10.1016/j.medengphy.2022.103825.
2. Воронцов К.В. Комбинаторный подход к оценке качества обучаемых алгоритмов. Математические вопросы кибернетики. М.: Физматлит, 2004. Т. 13. С. 5–36. URL: http://library.keldysh.ru/mvk.asp?id = 2004-5 (дата обращения: 30.09.2025).
3. Liu M.H., Chien S.Y., Wu Y.L., Sun T.H., Huang C.S., Hsu K.C., Hang L.W. EfficientNet-based machine learning architecture for sleep apnea identification in clinical single-lead ECG signal data sets // Biomedical Engineering Online. 2024. Vol. 23. Is. 1. Art. 57. URL: https://biomedical-engineering-online.biomedcentral.com/articles/10.1186/s12938-024-01252-w (дата обращения: 31.09.2025). DOI: 10.1186/s12938-024-01252-w.
4. Wan S., Wan F., Dai X. Machine learning approaches for cardiovascular disease prediction: A review, Archives of Cardiovascular Diseases. 2025. URL: https://www.sciencedirect.com/science/article/abs/pii/S1875213625003201 (дата обращения: 01.10.2025). DOI: 10.1016/j.acvd.2025.04.055.
5. Daharwal U., Singh I., Khekare G. Comparison of Machine Learning Algorithms for Heart Disease Prediction // Procedia Computer Science. 2025. Vol. 260. P. 12–21. URL: https://www.sciencedirect.com/science/article/pii/S1877050925009093 (дата обращения: 01.10.2025). DOI: 10.1016/j.procs.2025.03.172.
6. Diab E., Gacquer W., Nouboue C., Philippe D., Périn B., Chen S., De Jonckheere J., Szurhaj W. Electrocardiogram. (ECG)-based seizure detection using supervised machine-learning // Neurophysiologie Clinique. 2025. Vol. 55. Is. 5. P. 103098. URL: https://www.sciencedirect.com/science/article/pii/S0987705325000565 (дата обращения: 02.10.2025). DOI: 10.1016/j.neucli.2025.103098.
7. Vemishetty N., Gunukula R.L., Acharyya A., Puddu P.E., Das S., Maharatna K. Phase Space Reconstruction Based CVD Classifier Using Localized Features // Scientific Reports. 2019. Vol. 9. Is. 1. Art. 18730. URL: https://www.nature.com/articles/s41598-019-51061-8 (дата обращения: 02.10.2025). DOI: 10.1038/s41598-019-51061-8.
8. Liu Z., Yao G., Zhang Q., Zhang J., Zeng X. Wavelet Scattering Transform for ECG Beat Classification // Computational and Mathematical Methods in Medicine. 2020. Vol. 2020. Art. 3215681. URL: https://onlinelibrary.wiley.com/doi/10.1155/2020/3215681 (дата обращения: 03.10.2025). DOI: 10.1155/2020/3215681.
9. Cook D.A., Oh S.-Y., Pusic M.V. Accuracy of Physicians’ Electrocardiogram Interpretations: A Systematic Review and Meta-analysis // JAMA Internal Medicine. 2020. Vol. 180. № 11. P. 1461–1471. URL: https://pubmed.ncbi.nlm.nih.gov/32986084/ (дата обращения: 03.10.2025). DOI: 10.1001/jamainternmed.2020.3989.
10. Hannun A.Y., Rajpurkar P., Haghpanahi M., Tison G.H., Bourn C., Turakhia M.P., Ng A.Y. Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms using a deep neural network // Nature Medicine. 2019. Vol. 25. Is. 1. P. 65–69. URL: https://pubmed.ncbi.nlm.nih.gov/30617320/ (дата обращения: 03.10.2025). DOI: 10.1038/s41591-018-0268-3.
11. Sraitih M., Jabrane Y., Hajjam El Hassani A. A Robustness Evaluation of Machine Learning Algorithms for ECG Myocardial Infarction Detection // Journal of Clinical Medicine. 2022. Vol. 11. Is. 17. P. 4935. URL: https://www.mdpi.com/2077-0383/11/17/4935 (дата обращения: 03.10.2025). DOI: 10.3390/jcm11174935.
12. Davis J., Goadrich M. The relationship between Precision-Recall and ROC curves. Proceedings of the 23rd International Conference on Machine Learning – ICML. 2006. P. 233–240. URL: https://dl.acm.org/doi/10.1145/1143844.1143874 (дата обращения: 04.10.2025). DOI: 10.1145/1143844.1143874.
13. Nemirko A., Manilo L., Tatarinova A., Alekseev B., Evdakova E. ECG Fragment Database for the Exploration of Dangerous Arrhythmia (version 1.0.0). PhysioNet. 2022. URL: https://physionet.org/content/ecg-fragment-high-risk-label/1.0.0/ (дата обращения: 25.09.2025). DOI: 10.13026/kpfg-xs25.
14. Jahangir R., Islam M.N., Islam M.S., Islam M.M. ECG-based heart arrhythmia classification using feature engineering and a hybrid stacked machine learning // BMC Cardiovasc Disord. 2025. Vol. 25 (1). P. 260. URL: https://bmccardiovascdisord.biomedcentral.com/articles/10.1186/s12872-025-04678-9 (дата обращения: 03.10.2025). DOI: 10.1186/s12872-025-04678-9.
15. Воронцов К.В. Математические методы обучения по прецедентам (теория обучения машин). 2011. [Электронный ресурс]. URL: http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf (дата обращения: 23.10.2025).

Введение

Традиционные методы исследования сложных проблем, к которым относятся нелинейные и/или нестационарные задачи медицины, биологии, экологии, стремительно замещаются мультидисциплинарным подходом и растущим числом методов и алгоритмов, их реализующим [1]. Технологии машинного обучения (Machine Learning, ML) [2], извлекая неочевидные закономерности из многомерных наборов данных, способны конструировать наиболее надежный прогноз анализируемых показателей в наборах данных, характерных для биохимических и биофизических систем.

а)

б)

Рис. 1. Современные достижения в анализе ЭКГ-данных: а) основные направления и методы ЭКГ-анализа; б) степень точности определения патологий по ЭКГ Примечание: составлен авторами на основе источников [6–8] для а) и б) соответственно

Современная медицина активно внедряет методы ML (рис. 1, а) для совершенствования диагностики, прогнозирования и лечения заболеваний [3–5]. Одной из ключевых задач в этой области является классификация патологий сердца, играющая важную роль в раннем выявлении сердечно-сосудистых заболеваний, являющихся одной из ведущих причин смертности во всем мире (по данным Всемирной организации здравоохранения).

Однако точность определения патологий сердца при обработке ЭКГ-данных существенно различается у экспертов и алгоритмов [9, 10] (рис. 1, б).

Цель исследования – разработка ансамблевых алгоритмов с эффективностью выше эффективности базовых алгоритмов-операндов и сравнительное исследование ее свойств на выборке ограниченного объема первичных данных в открытом доступе.

Материалы и методы исследования

Полагаем, что диагностируемый набор исходных данных как сведения о некотором динамическом объекте в форме фрагментов временных рядов, порожденных случайным процессом:

, (*)

характеризующим состояние исследуемого объекта и принимающего значения в фазовом пространстве с σ-алгеброй подмножеств пространства, покрывающей всевозможные физические ситуации. При этом X(t) сопоставлен ненаблюдаемым (истинным) переменным состояния системы; Y(t) – случайная наблюдаемая функция; ξ(t) – неизвестный шум с ограниченной дисперсией. Относительно модели (*) на [t0, Т] выдвинуто n > 0 гипотез (диагнозов) (Ω1,…,Ωn), составляющих полную группу событий. Полагаем, что фрагмент реализации процесса (*) может принадлежать только одному из классов . Измерения Y(t) осуществляются по дискретному плану , . Задача состоит в построении решающего правила, относящего наблюдаемый фрагмент реализации случайного процесса Y(t) (*) к одному из классов и оценивании его качества в смысле заданных критериев.

В рамках описания (*) конструирование ансамбля моделей, в котором базовые алгоритмы кооперируются для получения более эффективного решения за счет взаимного парирования ошибок отдельных алгоритмов, осуществляем на основе ML.

В качестве базовых алгоритмов рассмотрим наиболее популярные [11]: метод опорных векторов (SVM), деревья решений, метод k-ближайших соседей (KNN), наивный байесовский алгоритм (Naive Bayes (NB)).

К общепринятым метрикам оценки эффективности алгоритмов машинного обучения [12] относят: Recall, Precision и F1-Score, оценивающие, в частности, ошибки 1, 2 родов (частоту ложноположительных и ложноотрицательных случаев, табл. 1), а также кривую ROC (Receiver Operating Characteristic), площадь под ней ROC-AUC (Area Under the ROC Curve).

Таблица 1

Матрица ошибок (Confusion Matrix) [13]

 

p

n

p

True Positive (TP)

False Positive (FP)

n

False Negative (FN)

True Negative (TN)

Описание условий эксперимента и результаты численного моделирования четырех базовых алгоритмов. На основе данных [13] сформирована выборка из 812 записей (360 двухсекундных фрагментов ЭКГ как признаков), сопоставленных четырем классам нарушений сердечного ритма: 1) опасные для жизни аритмии, требующие неотложной реанимации (трепетание желудочков; фибрилляция желудочков); 2) опасные для жизни желудочковые аритмии (желудочковая тахикардия высокой частоты: мономорфная и полиморфная); 3) суправентрикулярные аритмии (мерцательная аритмия, наджелудочковая тахикардия, синусовая брадикардия, блокада сердца первой степени, узловой ритм); 4) нормальный синусовый ритм с объемами выборок, равными 337, 169, 106, 200 записей соответственно.

Ансамбли алгоритмов. Конструирование ансамблевых алгоритмов осуществляется попарным стекингом в форме метамодели с целью получения более совершенной модели, которая будет содержать суперпозицию операндов – комбинируемых алгоритмов. В качестве метамодели использовалась логистическая регрессия, в которой в отличие от линейной свертки голосов алгоритмов с фиксированными коэффициентами используется более сложная стратегия алгоритмической суперпозиции, выявляющая неочевидные взаимосвязи и контекстные зависимости между алгоритмами, динамически определяя, предсказания какого алгоритма заслуживают большего доверия в текущих условиях (например, [2, 14, 15]).

Результаты исследования и их обсуждение

Реализация алгоритмов (рис. 2–7, табл. 2–4) производилась на языке Python 3.11+ с применением библиотек Pandas 2.2.3, NumPy 2.0.2, Scipy 1.13.1, Matplotlib 3.9.4, Scirit-Learn и модулей Time, Os; ссылка на веб-сервис GitHub с полным кодом проекта https://github.com/NikosSoRf/stat.git.

Рис. 2. Сравнительная диаграмма метрик алгоритмов до и после балансировки (устранение дисбаланса классов до 106 записей, метод Random Undersampling) Примечание: составлен авторами по результатам данного исследования

Рис. 3. Результат сравнения времени работы алгоритмов до и после балансировки Примечание: составлен авторами по результатам данного исследования

Таблица 2

Результаты сравнения свойств базовых алгоритмов для неравномерного и равномерного наборов ( / )

Model

Accuracy

Precision

Recall

F1 Score

ROC-AUC

Training Time (s)

Prediction Time (s)

Total Time

SVM

0,6762/

0,7344

0,6737/

0,7783

0,6762/

0,7344

0,6664/

0,7378

0,8736/

0,9284

0,7478/

0,1087

0,1833/

0,0250

0,9311/

0,1337

KNN

0,6557/

0,5547

0,6538/

0,6297

0,6557/

0,5547

0,6522/

0,5562

0,8327/

0,8443

0,0200/

0,0010

0,3347/

0,1472

0,3547/

0,1482

NB

0,6024/

0,5781

0,6163/

0,6615

0,6270/

0,5781

0,5898/

0,5501

0,8273/

0,8538

0,0156/

0,0114

0,0347/

0,0210

0,0503/

0,0402

Примечание: составлена авторами на основе полученных данных в ходе исследования.

Рис. 4. Матрицы ошибок алгоритмов в условиях равномерного распределения объектов римечание: составлен авторами по результатам данного исследования

Подбор параметров осуществлен методом GridSearch, диапазоны рассматриваемых параметров GridSearch: для SVM C: [0.1, 1, 10, 100], kernel: [‘linear’, ‘rbf’, ‘poly’], gamma: [‘scale’, ‘auto’, 0.1, 0.01], для KNN n_neighbors: [3, 5, 7, 9, 11], weights: [‘uniform’, ‘distance’], metric: [‘euclidean’, ‘manhattan’, ‘minkowski’]; для SVM – радиальная функция с параметрами C = 40, gamma = 0.1; для KNN k = 5; p = 2 для L2 нормы, weights = uniform; для NB параметр сглаживания 10- 6. Оценка качества модели осуществлялась на основе кросс-валидации (30 и 70 % от исходного объема на тестовую и обучающую выборки) с использованием out-of-fold в методе cross_val_predict (см. текст программы https://github.com/NikosSoRf/stat.git). В связи с ограниченным объемом сбалансированной выборки (106 наблюдений, 4 класса) для оценки стабильности модели применена 10-кратная стратифицированная кросс-валидация.

Рис. 5. Матрицы ошибок ансамблей алгоритмов Примечание: составлен авторами по результатам данного исследования

Рис. 6. Графики ROC кривых для ансамблевых алгоритмов Примечание: составлен авторами по результатам данного исследования

Рис. 7. Сравнительные диаграммы метрик точности ансамблевых алгоритмов Примечание: составлен авторами по результатам данного исследования

Таблица 3

Результаты сравнения ансамблей алгоритмов до и после аугментации ( / )

Model

Accuracy

Precision

Recall

F1 Score

ROC-AUC

Training Time (s)

Prediction Time (s)

Total Time

SVM_KNN

0,7235/

0,8811

0,7430/

0,8902

0,7235/

0,891176

0,7269/

0,8901

0,9067/

0,9808

0,2410/

0,3989

0,0140/

0,0180

0,2550/

0,4170

SVM_NB

0,7529/

0,8705

0,7716/

0,8734

0,7529/

0,8705

0,7552/

0,8702

0,9040/

0,9724

0,2330/

0,3921

0,0120/

0,0137

0,2450/

0,4059

KNN_NB

0,6941/

0,8705

0,7080/

0,8740

0,6941/

0,8706

0,6965/

0,8707

0,8768/

0,9696

0,0380/

0,0772

0,0040/

0,0123

0,0420/

0,089

Примечание: составлена авторами на основе полученных данных в ходе исследования.

Таблица 4

Статистические показатели для средней точности предсказания с уровнем значимости p = 0,05

Model

Average Accuracy

Standard Deviation

Confidence intervals

SVM

0,8397

0,0289

(0,8143, 0,8650)

KNN

0,8161

0,0303

(0,7896, 0,8427)

NB

0,5111

0,0372

(0,4785, 0,5437)

SVM_KNN

0,8599

0,0326

(0,8314, 0,8885)

SVM_NB

0,8363

0,0316

(0,8086, 0,8640)

KNN_NB

0,8280

0,0129

(0,8167, 0,8392)

Примечание: составлена авторами на основе полученных данных в ходе исследования

Из рис. 4 и 5 следует явное преимущество ансамблевых методов перед отдельными алгоритмами, при этом благодаря некоррелированности ошибок базовых алгоритмов (SVM, KNN, NB) их комбинация не только повышает общую точность, но и значительно улучшает сбалансированные метрики для слабо определяемых классов, обеспечив более надежную и устойчивую диагностическую систему.

Ансамбль SVM-NB (рис. 7) демонстрирует самую высокую и стабильную производительность по большинству классов, достигнут лучший результат по 0-му классу (опасные для жизни аритмии) и имеет место определенный баланс результатов относительно других классов. Ансамбль SVM-KNN является менее уверенным и стабильным из рассмотренных с самым низким значением у 0-го класса, а ансамбль KNN-NB оказался наименее эффективным без явных преимуществ перед соперниками, по всем классам есть пары, которые показывают равный или лучший результат (рис. 6, 7; табл. 3).

Из табл. 3 следует, что ансамбль SVM-NB достигает наивысших значений по ключевым метрикам Accuracy (табл. 4), Precision, Recall и F1-Score, при этом его общее время выполнения остается конкурентоспособным.

Ансамбль SVM-KNN показывает очень близкий результат по ROC-AUC (0.907) и является самым быстрым среди коллективов с SVM. В свою очередь, ансамбль KNN-NB, несмотря на рекордную скорость работы (0,042 с), существенно уступает конкурентам по всем метрикам точности, что не позволяет считать его эффективным для данной задачи.

Аугментация выборки на основе метода Smoothing привела к увеличению размера данных в 2 раза (до 848 записей, по 212 на класс) и ожидаемо к улучшению результатов (после дробной черты в табл. 3). При этом тестирование проходило на нескольких методах аугментации: noising, scaling, smoothing. Метод с шумом не показал существенно лучших результатов, но сильно увеличил время обработки данных.

Из табл. 3 следует, что точность ансамблевых алгоритмов возросла, но увеличились временные затраты на обучение (почти в 2 раза у каждой модели) и ответа алгоритмов (на 0,04 с у моделей с SVM и в 3 раза у моделей без SVM в условиях ниже приведенных параметров вычислительного устройства).

Эксперименты проводились на основе операционной системы Windows 10; аппаратная конфигурация включала процессор Intel Core i3-5005U (2,00 GHz), 8 ГБ оперативной памяти DDR3 и интегрированную графику Intel HD Graphics 5500. Внешние Python-библиотеки, необходимые для работы проекта, представлены в файле requirements.txt.

Заключение

В статье представлены результаты сравнительного анализа наиболее часто используемых алгоритмов машинного обучения для задачи четырехмерной классификации патологий сердца на первичных данных в условиях ограниченного объема выборки. Результаты данной работы могут быть полезны при разработке веб-сервиса для апробации потоковой диагностики по ограниченным данным. Дальнейшее развитие в этом направлении авторы связывают с параллельным решением следующих задач: 1) разработка масштабируемой проблемно-ориентированной программной системы для иерархического поиска эффективных композиций и ансамблевых алгоритмов на большом наборе данных; 2) создание метамодели коллектива алгоритмов, обучающейся на разнотипных данных.


Конфликт интересов
Авторы заявляют об отсутствии конфликта интересов.

Библиографическая ссылка

Николаева С.М., Колесникова С.И. ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ АНСАМБЛЕЙ АЛГОРИТМОВ НА ПРИМЕРЕ КЛАССИФИКАЦИИ ПАТОЛОГИЙ СЕРДЦА ПО ОГРАНИЧЕННОЙ ВЫБОРКЕ ПЕРВИЧНЫХ ДАННЫХ // Современные наукоемкие технологии. 2025. № 11. С. 158-164;
URL: https://top-technologies.ru/ru/article/view?id=40580 (дата обращения: 12.12.2025).
DOI: https://doi.org/10.17513/snt.40580