Введение
В настоящее время обучающиеся Южно-Уральского государственного медицинского университета (ЮУГМУ), обучаясь на кафедре математики, медицинской информатики, информатики и статистики, физики, изучают методы машинного обучения в контексте их реализации в медицинских исследованиях. В рамках требований федерального государственного образовательного стандарта высшего образования по направлению специалитета 31.05.01 Лечебное дело, утвержденного приказом Министерства науки и высшего образования Российской Федерации от 12 августа 2020 г. № 9881, была разработана и внедрена новая дисциплина «Применение методов искусственного интеллекта в медицинских исследованиях». Преподаватели кафедры, опираясь на практический опыт, осуществляют совместные исследования в области интеграции искусственного интеллекта в учебный процесс медицинского университета, в том числе направленные на разработку технологии обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения в курсе дисциплин по искусственному интеллекту (ИИ-дисциплин).
Цель исследования – обосновать технологию обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения, реализованных на языке программирования Python, в рамках дисциплины «Применение методов искусственного интеллекта в медицинских исследованиях». В контексте дисциплины обучающимся предложена реализация основных методов машинного обучения на языке Python: классификация числовых данных с использованием ансамблевых методов; классификация числовых и категориальных данных с использованием нейронных сетей; распознавание медицинских изображений с использованием сверточных нейронных сетей; обработка клинических текстов.
Материалы и методы исследования
Методологическая база исследования базируется на идеях следующих подходов:
1. Системного подхода, ориентирующего на разработку технологии обучения будущих врачей решению клинико-ориентированных заданий как целостной педагогической системы, включающей ряд ее структурных компонентов – блоков с определенным содержанием и выполняемыми функциями [1, с. 108; 2, с. 48].
2. Компетентностного подхода, позволяющего осуществить проектирование технологии обучения будущих врачей решению клинико-ориентированных заданий в логике ориентации на конечные образовательные результаты – сформированные ИИ-компетенции обучающихся медицинского вуза [3; 4].
3. Личностно-деятельностного подхода, как научного обоснования выбора системы клинико-ориентированных заданий, обеспечивающей формирование ИИ-компетенций и развития личности обучающегося [5, с. 243; 6, с.115].
4. Интегративного подхода, который позволяет рассматривать технологию обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения как педагогическую систему, объединяющую содержание медицинских и ИИ-дисциплин и обеспечивающую синтез межпредметных знаний [7; 8].
Для реализации цели исследования были использованы следующие методы: анализ научно-педагогической литературы, нормативных документов по проблеме исследования, классификация, систематизация информации, анализ и сравнение методов машинного обучения [9–11].
Результаты исследования и их обсуждение
Технология обучения будущих врачей решению клинико-ориентированных заданий – это структурированная педагогическая система, основанная на блочном принципе и направленная на формирование у будущих врачей компетенций в области искусственного интеллекта и анализа клинических данных. Технология включает в себя целевой, содержательный, процессуально-методический и диагностико-оценочный блоки. Блочный принцип структурирования технологии выбран исходя из того, что он фиксирует линейный порядок реализации: сначала определяется цель, затем отбирается содержание, после выстраивается процесс с методическим сопровождением, и только на завершающем этапе проводится диагностика и оценка.
Целевой блок включает цель, задачи и планируемые результаты деятельности обучающихся, ориентированные на формирование у обучающихся компетенций в области искусственного интеллекта.
Содержательный блок представлен теоретической базой и системой клинико-ориентированных заданий, в которых с помощью методов машинного обучения моделируются реальные клинические ситуации. В процессе освоения ИИ-дисциплины обучающиеся изучают основы работы с языком программирования Python, интерактивными средами выполнения кода PyCharm Community Edition и Google Colab, знакомятся с библиотеками Pandas, NumPy и Matplotlib. На практических занятиях обучающимся предложена реализация основных методов машинного обучения с помощью системы клинико-ориентированных заданий, в которых выполняется обработка открытых наборов медицинских данных (Heart, Diabetes, Breast Cancer и др.).
Процессуально-методический блок включает дидактические этапы выполнения клинико-ориентированных заданий с помощью машинного обучения и методы его реализации. Например, метод комментированного кода, при котором каждый шаблон программы на Python выступает как дидактический инструмент для освоения сложного технического материала. Шаблоны программ снабжены подробными комментариями, объясняющими назначение команд и функций, математический смысл параметров; клиническую интерпретацию выходных данных и рассчитанных метрик [12–14]. Выполнение клинико-ориентированных заданий с помощью машинного обучения включает в себя следующие дидактические этапы (табл. 1).
Диагностико-оценочный блок технологии обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения включает диагностические критерии, методы для измерения глубины освоения знаний, отработки ИИ-навыков и механизмы обратной связи.
Таблица 1
Дидактические этапы выполнения клинико-ориентированных заданий
|
Этап |
Педагогическая задача |
Содержание деятельности студента |
|
1 |
Формирование навыков работы с реальными клиническими данными |
Загрузка и очистка набора медицинских данных |
|
2 |
Развитие умений визуализации и первичного анализа медицинских данных |
Вычисление описательных статистик, корреляционной матрицы, построение гистограмм и диаграмм размаха |
|
3 |
Освоение принципов валидации ИИ-моделей в медицине. Понимание влияния параметров алгоритмов на качество диагностики |
Разделение набора данных на обучающую и тестовую выборки. Конфигурирование параметров классификаторов |
|
4 |
Формирование представлений о процессе обучения ИИ-систем |
Машинное обучение на данных обучающих выборок |
|
5 |
Умение оценивать надежность ИИ-моделей |
Расчет метрик классификации на тестовых выборках |
|
6 |
Развитие навыков клинической интерпретации результатов работы ИИ |
Классификация заболеваний для новых пациентов с вычислением вероятностей принадлежности к классам |
Примечание: составлена авторами на основе полученных данных в ходе исследования.
Таблица 2
Критерии и показатели апробации
|
Критерий |
Показатель |
|
1. Освоение дидактических этапов работы с клиническими данными и ИИ |
Доля студентов, успешно выполнивших все 6 этапов (табл. 1) |
|
2. Качество выполнения клинико-ориентированных заданий |
Средний балл за реализацию методов машинного обучения на открытых наборах (Heart, Diabetes и др.) |
|
3. Сформированность ИИ-компетенций |
Результаты тестирования по Python, Pandas, NumPy, Matplotlib; правильность интерпретации метрик |
|
4. Удовлетворенность обучением |
Оценка студентами методики (анкета, % положительных ответов) |
|
5. Применимость в клиническом контексте |
Корректность клинической интерпретации результатов классификации (экспертная оценка) |
Примечание: составлена авторами на основе полученных данных в ходе исследования.
Ниже представлены критерии и показатели апробации данной технологии (табл. 2).
Далее остановимся на содержании и реализации этапов машинного обучения в процессе изучения дисциплины «Применение методов искусственного интеллекта в медицинских исследованиях».
Исходными данными для машинного обучения послужили следующие общедоступные медицинские наборы: набор Heart, включающий сведения о 304 пациентах с сердечно-сосудистыми заболеваниями; набор Diabetes – о 442 пациентах с диабетом; набор Breast Cancer Wisconsin (Original) – о результатах биопсии 699 пациенток с раком молочной железы; набор Parkinsons – о голосовых характеристиках 197 пациентов с болезнью Паркинсона и здоровых людей; наборы column_3C_weka, column_2C_weka – о форме и ориентации таза, поясничного отдела позвоночника 310 пациентов; набор Breast Cancer – о 286 пациентках с раком молочной железы.
1. Загрузка и очистка наборов данных
Для загрузки данных медицинских наборов используется метод read_csv из библиотеки pandas. Удаление строк с пропущенными значениями и перезагрузка индекса осуществляется с помощью методов dropna и reset_index соответственно.
2. Вычисление описательных статистик
Вычисление описательных статистик и корреляционной матрицы осуществляется с помощью методов describe и corr соответственно из библиотеки pandas.
3. Разделение набора данных на обучающую и тестовую выборки
Загруженный набор df предварительно разбивают на выходные данные (y) и входные данные (X). Для разделения входных и выходных данных данные на обучающую и тестовую выборки используется функция train_test_split из библиотеки scikit-learn, при этом пропорция данных в тестовой выборке задается с помощью параметра test_size.
4. Машинное обучение на данных обучающих выборок
Для изучения и практической реализации дифференциальной диагностики заболеваний были предложены следующие методы машинного обучения.
Логистическая регрессия позволяет устанавливать связь между категориальной бинарной переменной (y) и набором независимых количественных и категориальных переменных (𝑥0, 𝑥1,…𝑥j). В результате проведения данного анализа можно получить модель классификации, показывающую вероятность принадлежности объекта к одному из двух классов (кодируются 0 и 1). Класс LogisticRegression из библиотеки scikit-learn позволяет построить полную модель логистической регрессии. Для включения в модель логистической регрессии только определенных переменных используется библиотека statsmodels.
Метод опорных векторов – это алгоритм машинного обучения, используемый для решения задач классификации с учителем, в ходе которого строится гиперплоскость в n-мерном пространстве, разделяющая объекты двух или более классов. Класс SVC из библиотеки scikit-learn позволяет построить модель методом опорных векторов.
Метод k-ближайших соседей используется в машинном обучении для решения задач классификации. В основе этого метода лежит идея о том, что объект принадлежит к тому классу, к которому принадлежит большинство его ближайших соседей. Класс KNeighborsClassifier из библиотеки scikit-learn позволяет построить модель k-ближайших соседей. Обучение этой модели осуществляется с помощью метода fit.
Дерево решений является древовидной иерархической структурой, осуществляющей классификацию объектов с помощью решающих правил формата «если…, то…». Узлы дерева содержат решающие правила, а листья – объекты, относящиеся только к определенным классам. Класс DecisionTreeClassifier из библиотеки scikit-learn позволяет построить модель дерева решений, обучение которой осуществляется с помощью метода fit.
Модель случайного леса (Random Forest Classifier) является алгоритмом машинного обучения, использующим ансамбль решающих деревьев для решения задач классификации. Класс RandomForestClassifier из библиотеки scikit-learn позволяет построить модель дерева решений. Обучение осуществляется с помощью метода fit.
Модель Stacking – это метод объединения оценок для уменьшения их систематических ошибок. Прогнозы каждой отдельной модели складываются вместе и используются в качестве входных данных для окончательной модели и вычисления прогноза. Класс StackingClassifier из библиотеки scikit-learn позволяет построить модель Stacking, использующую несколько классификаторов (параметр estimator) и объединяющую оценки этих классификаторов с помощью параметра final_estimatores.
Модель Bagging – это класс алгоритмов в ансамблевых методах, которые создают несколько экземпляров моделей классификаторов на случайных подмножествах исходного обучающего набора, а затем объединяют их отдельные прогнозы для формирования окончательного прогноза. Класс BaggingClassifier из библиотеки scikit-learn позволяет построить модель Bagging, использующую n классификаторов (параметр n_estimators) заданного типа (параметр estimator).
В полносвязной нейронной сети прямого распространения нейроны каждого слоя соединены со всеми нейронами предыдущего слоя. Типовой задачей для сети этого типа является классификация данных. Класс MLPClassifier из библиотеки scikit-learn позволяет построить полносвязную нейронную сеть, содержащую заданное количество нейронов на скрытых слоях (параметр hidden_layer_sizes) с определенными функциями активации (параметр activation) [15].
5. Расчет метрик классификации на тестовых выборках
Для вычисления метрик классификации на тестовой выборке предварительно необходимо предсказать классы заболеваний с помощью функции logr.predict. Отчет с основными метриками классификации (precision, accuracy, recall и F1-score) выводится с помощью функции classification_report из библиотеки sklearn.metrics.
6. Классификация заболеваний для новых пациентов
Предсказание классов заболеваний для новых пациентов осуществляется с использованием обученных моделей классификаторов. Для этого предварительно создается DataFrame c показателями пациента. Затем, используя метод predict, проводится классификация заболевания (Class_Anne) и вывод вероятностей (Probability_estimates) принадлежности к классам.
Результаты исследования и их обсуждение
Выполнение клинико-ориентированных заданий с помощью предложенных дидактических этапов и шаблонов программ, содержащих технические, математические и клинические комментарии, показали высокую результативность при обработке медицинских данных в ходе практических занятий по дисциплине «Применение методов искусственного интеллекта в медицинских исследованиях».
В результате апробации технологии обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения получены следующие количественные результаты: 85 % студентов выполняют все этапы без критических ошибок; средний балл за задания – 4,2 из 5; прирост тестового балла (до/после) – на 30 %; доля студентов, правильно интерпретирующих вероятности принадлежности к классам (клинический вывод), – ≥ 80 %.
Наряду с количественными данными были зафиксированы качественные результаты – обучающиеся осознанно используют комментарии в шаблонах кода как дидактическую опору; понимают влияние параметров классификаторов на качество диагностики; способны визуализировать реальные медицинские данные; формируется целостное представление о цикле обучения ИИ-модели в приложении к клинической задаче.
Несмотря на высокие результаты, в процессе внедрения технологии выявлены следующие риски: техническая сложность для медиков, зависимость от инфраструктуры, трудоемкость шаблонов, искусственность данных, линейность, перекос в технические детали, отсутствие клинического эксперта, разный темп обучения. Однако перечисленные риски могут быть минимизированы с помощью вводного модуля Python, использования Google Colab, коллективной разработки шаблонов, добавления шумов в данные, петель обратной связи, клинической формулировки заданий, привлечения ординаторов-тьюторов и дифференцированных заданий с плавающими дедлайнами.
Разработанная технология обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения является адаптивной (метод комментированного кода позволяет обучающимся, не имеющим углубленных навыков программирования, сосредоточиться на интерпретации полученных результатов, а не на технических деталях программирования); профессионально направленной (клинико-ориентированные задания повышают мотивацию обучающихся за счет связи с будущей профессией); универсальной (может быть адаптирована для любых медицинских специальностей при изучении ИИ-дисциплин) и обеспечивает формирование критического мышления у будущих врачей (критическое оценивание результатов систем искусственного интеллекта).
Имплементация учебных ИИ-дисциплин («Основы искусственного интеллекта», «Применение методов искусственного интеллекта в медицинских исследованиях») в образовательный процесс ЮУГМУ стала важным этапом формирования компетенций обучающихся медицинского вуза в области использования искусственного интеллекта.
Заключение
Высокая сложность освоения классификаторов машинного обучения обусловливает необходимость их разбора студентами медицинского вуза непосредственно в клиническом контексте с использованием готовых шаблонов программ. В дальнейшем студенты адаптируют эти шаблоны под нужные параметры и новые данные, интегрируя технические и клинические знания.
Такой подход позволяет будущим врачам, не имеющим глубоких знаний и навыков программирования, поэтапно строить бинарные, многоклассовые классификаторы и прогнозировать заболевания. Изучение машинных методов формирует фундаментальные знания об искусственном интеллекте и практические навыки использования интеллектуальных систем в диагностике, лечении и профилактике.
Разработанная технология обучения будущих врачей решению клинико-ориентированных заданий с применением методов машинного обучения обеспечивает практико-ориентированное освоение методов машинного обучения, формирование ИИ-компетенций и междисциплинарную интеграцию математической (знание математического смысла параметров), информационной (знание программирования на Python и начальные умения работы с библиотеками) и клинической подготовки (понимание диагностических задач, умения интерпретации результатов).
[1] Приказ Министерства науки и высшего образования РФ от 12 августа 2020 г. № 988 «Об утверждении федерального государственного образовательного стандарта высшего образования – специалитет по специальности 31.05.01 Лечебное дело» (с изм. и доп. от 26 ноября 2020 г., 19 июля 2022 г., 27 февраля 2023 г.) [Электронный ресурс]. URL: https://fgos.ru/fgos/fgos-31-05-01-lechebnoe-delo-988/ (дата обращения: 12.03.2026).
Конфликт интересов
Финансирование
Библиографическая ссылка
Диденко Г. А., Касюк С. Т., Степанова О. А. ТЕХНОЛОГИЯ ОБУЧЕНИЯ БУДУЩИХ ВРАЧЕЙ РЕШЕНИЮ КЛИНИКО-ОРИЕНТИРОВАННЫХ ЗАДАНИЙ С ПРИМЕНЕНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ // Современные наукоемкие технологии. 2026. № 6. С. 247-252;URL: https://top-technologies.ru/ru/article/view?id=40842 (дата обращения: 03.07.2026).
DOI: https://doi.org/10.17513/snt.40842



