HYPERPARAMETER TUNING SIMULATOR FOR MACHINE LEARNING MODELS WITH DYNAMIC VISUALIZATION OF QUALITY METRICS AS A MEANS OF DEVELOPING PROFESSIONAL COMPETENCIES OF STUDENTS IN TECHNICAL FIELDS

Dogadina E.P. 1, 2

1 Federal State Educational Budgetary Institution of Higher Education “Financial University under the Government of the Russian Federation”

2 Federal State Budgetary Educational Institution of Higher Education “MIREA – Russian Technological University”

Article in PDF

2655 KB

This article examines the trends in digitalization and interactivity in the development of machine learning technologies by students majoring in Applied Informatics and Applied Mathematics and Informatics, as well as the transition from static to dynamic visualizations in solving machine learning problems. Traditional teaching methods, based on static code analysis and theoretical derivations, often do not allow for a clear demonstration of the impact of hyperparameters on model quality and the geometry of decision-making. The aim of the work is to justify a pedagogical technology for using an interactive simulator for tuning machine learning model hyperparameters as a means of developing professional competencies in students of technical training programs, as well as to experimentally test its effectiveness in the professional education system based on a quasi-experimental study. The work presents the architecture of the application and the graphical user interface of the implemented machine learning algorithms. A key feature of the developed system is the ability to dynamically visualize training processes in real time: when the user changes hyperparameter values, approximation graphs (for regression tasks) and decision boundary maps (for classification tasks) are instantly rebuilt, and quality metrics are also updated. The relevance of this study lies in the implementation of the developed simulator in student learning to develop professional machine learning competencies based on the principle of dynamic visualization, which facilitates the transition from the repetitive acquisition of algorithms to conscious, cause-and-effect modeling of their behavior. The study’s results demonstrate that the use of an interactive simulator improves the quality of students’ professional competencies in technical training and helps reduce the time required to master machine learning concepts such as visualization of separating surfaces and regression curves, overfitting diagnostics using geometric artifacts, and contextual interpretation of quality metrics. The developed software tool is recommended for use in the educational process of universities when studying disciplines related to data mining and artificial intelligence.

university

students

technical fields of study

machine learning

simulator

cognitive load

quasi-experiment

educational resource assessment system

Введение

Современный этап развития информационных технологий характеризуется стремительным ростом объема данных и повсеместным внедрением методов машинного обучения (МО) в различные сферы человеческой деятельности. Алгоритмы регрессии и классификации являются базовыми инструментами принятия решений в большом спектре задач: от прогнозирования финансовых показателей до медицинской диагностики [1, 2]. В связи с этим возрастает потребность в подготовке высококвалифицированных специалистов в области интеллектуального анализа данных и разработки алгоритмов МО. В условиях цифровой трансформации экономики ключевым результатом обучения становится способность выпускника не только применять готовые библиотеки МО и анализа данных, но и осознанно настраивать гиперпараметры моделей, интерпретировать геометрию принимаемых решений и диагностировать качество прогнозов. Разработанный симулятор с динамической визуализацией выступает методическим средством, обеспечивающим переход от формального применения алгоритмов к глубокому пониманию их внутреннего поведения. На текущем этапе развития IT-инфраструктуры методы машинного обучения стали неотъемлемой частью прикладных задач – от финансового прогнозирования до систем поддержки принятия решений [3, 4]. Это требует подготовки специалистов, способных не просто вызывать функции готовых библиотек, а понимать внутренние механизмы алгоритмов. Однако на практике переход от теории к реализации вызывает существенные затруднения. Студентам любых направлений подготовки, чье обучение связано с изучением методов машинного обучения, трудно интуитивно связать математическую модель с ее поведением в коде. Речь идет о таких базовых методах, как k-ближайших соседей (k-NN), случайный лес, логистическая и линейная регрессия, деревья решений. В учебном процессе при преподавании дисциплины «Машинное обучение» они часто подаются как набор формул, которые нужно запомнить, а не как инструменты, поведение которых можно контролировать.

Система дидактических препятствий, возникающих в процессе усвоения учебного материала и препятствующих формированию устойчивых профессиональных компетенций, заключается в том, что студент зачастую не понимает суть выполненных преобразований, а просто подбирает исходные значения гиперпараметров для получения оптимального результата. В зависимости от используемого метода машинного обучения в качестве гиперпараметров могут быть представлены количество соседей, глубина дерева, коэффициент регуляризации [5]. В настоящее время обучение студентов проходит с использованием сред программирования, в которых процесс настройки гиперпараметров, их визуализация, а также сам процесс обучения остается неохваченным. Это препятствует глубокому усвоению материала и формированию профессиональных компетенций.

Для качественного понимания принципов машинного обучения важно видеть, как меняется качество модели (точность, F1-мера, ошибка аппроксимации) непосредственно во время изменения параметров [6]. Без использования интерактивного инструмента, позволяющего отслеживать эту динамику в реальном времени, материал запоминается формально [7].

На современном рынке образовательных и исследовательских программных продуктов представлен ряд инструментов, поддерживающих работу с методами машинного обучения [8–10]. Их можно условно разделить на три категории: промышленные платформы автоматизированного машинного обучения (AutoML), веб-ориентированные образовательные визуализаторы и специализированные библиотеки для анализа данных.

Промышленные платформы и среды разработки (Jupyter Lab, Google Colab, Scikit-learn) обладают гибкостью, имеют возможность работы с большими данными и обширную документацию. Однако данные среды требуют навыков программирования. Стремление понятно донести до студентов принципы реализации задач машинного обучения привело к появлению инструментов, изначально ориентированных на визуализацию принципов машинного обучения. Наиболее известный из них – TensorFlow Playground – позволяет в интерактивном режиме наблюдать за обучением нейросети прямо в браузере. Другой подход реализован в Orange Data Mining, где модель строится по принципу визуального программирования через соединение блоков (виджетов). Эти инструменты действительно дают возможность быстро сформировать базовое понимание процессов.

Тем не менее за наглядность приходится платить гибкостью. Анализ их архитектурных решений выявляет ряд системных ограничений. Во-первых, подавляющее большинство подобных сред являются веб-ориентированными, что делает их использование проблематичным в условиях отсутствия устойчивого сетевого соединения. Во-вторых, акцент сделан на нейросетевые архитектуры или базовую классификацию. Ключевые методы, такие как k-NN с варьируемыми метриками расстояния или деревья решений с настройкой критериев разделения, реализованы схематично, а их специфические параметры либо скрыты от пользователя, либо заблокированы на уровне интерфейса.

Чтобы оценить методический потенциал использования разработанного симулятора в учебном процессе, целесообразно сопоставить его с доступными программными средствами, обратив внимание на степень интерактивности, целевое назначение, набор поддерживаемых алгоритмов и возможности внедрения в учебный процесс.

В области подбора гиперпараметров преобладают решения, созданные под нужды AutoML-исследований [11]. Показательным здесь выступает проект DeepCAVE, предназначенный для ретроспективного изучения результатов оптимизации. Система корректно обрабатывает выводы таких оптимизаторов, как SMAC или Optuna, и строит детальные графики траекторий поиска, чувствительности параметров и распределения вычислительного бюджета. При этом архитектура платформы заточена под анализ завершенных запусков, что подразумевает уверенное владение студента форматами логов и понимание процедур оптимизации гиперпараметров. Возможность «живого» экспериментирования с параметрами в ней не предусмотрена, а высокий уровень знаний делает DeepCAVE неудобным для студентов, которым на начальном этапе важнее не получить оптимальную конфигурацию, а проследить причинно-следственную связь между настройкой алгоритма и изменением его прогнозирующей поверхности.

Библиотека Yellowbrick работает несколько иначе, чем стандартные инструменты, расширяя scikit-learn визуальными средствами для диагностики [12]. В ней находятся множество визуализаторов: от оценки качества разбиения данных до анализа важности признаков и остатков. Однако статичные отчеты не дают нужной гибкости. Чтобы посмотреть новый график, нужно каждый раз писать вызов в коде, потом перезапускать ядро и только после этого вникать в суть. Студент вместо наблюдения за тем, как меняется граница при сдвиге гиперпараметра, вынужден отвлекаться на отладку скриптов. Аналогичные проблемы есть и у научной литературы по данной тематике, а также у официальной документации scikit-learn, обладающей хорошей теоретической базой. Однако для начального обучения этого недостаточно, и подбор параметров превращается в механический перебор, а визуальная сторона работы алгоритма так и остается скрытой за числовыми отчетами.

Что касается систем TensorBoard, то они ориентированы на нейросети и мониторинг их обучения [13]. Они эффективно визуализируют распределение градиентов и архитектуру вычислительных графов, но жестко привязаны к фреймворку TensorFlow и не работают с табличными моделями машинного обучения. В качестве альтернативы для новичков часто упоминают TensorFlow Playground – браузерный тренажер, позволяющий в реальном времени менять структуру сети и наблюдать за реакцией модели. Действительно, мгновенная обратная связь подтверждает дидактическую ценность интерактивности. Вместе с тем узкий фокус на многослойных перцептронах, обязательное наличие интернета и отсутствие поддержки классических алгоритмов (деревьев, ансамблей, метрических методов) сужают область применения Playground. Для полноценного курса по машинному обучению, где требуется последовательное освоение базовых методов, этого недостаточно.

Для решения педагогической задачи формирования интуитивного понимания влияния гиперпараметров на поведение моделей машинного обучения была разработана программа на Python (фреймворк PyQt5), которая позволяет визуально сопоставлять настройку гиперпараметров с результатами предсказания в режиме реального времени. Это дает возможность проводить эксперименты в режиме реального времени и наблюдать за геометрией моделирования наглядно.

Цель исследования – научно-методическое обоснование педагогической технологии использования интерактивного симулятора настройки гиперпараметров моделей машинного обучения как средства формирования профессиональных компетенций студентов технических направлений подготовки, а также экспериментальная проверка ее эффективности в системе профессионального образования на основе квазиэкспериментального исследования.

Материалы и методы исследования

Педагогические исследования последних лет последовательно указывают на преимущества сред, построенных по принципу прямой манипуляции объектами. Когда студент видит немедленную реакцию системы на изменение входных условий, формируется более устойчивая ментальная модель изучаемого явления. При этом отмечается системная проблема: большинство доступных решений либо требуют уверенного владения программированием, либо концентрируются исключительно на глубоком обучении (подмножестве машинного обучения), игнорируя фундаментальные алгоритмы, составляющие основу академических программ.

В работе [14] по цифровой дидактике авторы подчеркивают, что на начальном этапе важно снижать когнитивную нагрузку на студентов. Интерфейс должен брать на себя рутину, освобождая место для анализа того, как ведет себя модель. Поэтому разрыв между профессиональными аналитическими платформами и примитивными веб-демонстрациями остается довольно заметным. Симулятор, о котором идет речь в статье, как раз закрывает эту нишу. Акцент здесь не на инженерной автоматизации, а на наглядности обучения. В отличие от систем типа DeepCAVE или Yellowbrick, представленный в работе симулятор действует в реальном времени и не требует от студентов навыков программирования. А от браузерных приложений для нейросетей его выгодно отличает автономность, работа с локальными датасетами и поддержка классических алгоритмов обучения с учителем.

Поэтому разработка универсальной настольной программы с широким набором алгоритмов и удобным графическим интерфейсом становится вполне актуальной задачей.

Главная цель такого приложения будет заключаться в мгновенной обратной связи. Если студент меняет значение параметра, система должна обновлять графики и метрики качества без задержек. Только такой формат позволит по-настоящему увидеть, как меняются разделяющие границы и кривые машинного обучения, превращая абстрактные цифры в наглядную модель поведения алгоритма.

Рис. 1. Структурная схема работы приложения Примечание: составлен автором на основе анализа предметной области

Разработанное приложение построено по модульной архитектуре с четким разделением ответственности между компонентами, что соответствует принципам MVC (Model View Controller) и обеспечивает масштабируемость кода. Общая структура системы представлена на рис. 1.

Такой интерфейс обеспечивает баланс между функциональностью и простотой, позволяя студентам сосредоточиться на анализе результатов, а не на отладке кода.

Результаты исследования и их обсуждение

В данной работе представлен симулятор настройки гиперпараметров моделей машинного обучения с динамической визуализацией метрик качества, написанный на Python с использованием фреймворка PyQt5 и библиотеки scikit-learn [15, 16].

Это приложение реализует:

− Выбор алгоритма: линейная регрессия, дерево решений, k-ближайших соседей (k-NN), случайный лес, логистическая регрессия.

− Генерацию синтетических данных (для регрессии и классификации), а также загрузку готового датасета.

− Динамическую настройку гиперпараметров через ползунки.

− Мгновенную перерисовку графика предсказаний и отображение метрик качества.

Центральным элементом симулятора является модуль обучения моделей, реализующий ключевые [17, 18] алгоритмы контролируемого обучения.

Традиционная оценка качества модели через числовые метрики (accuracy, f1-score и т. д.) скрывает характер ошибок. Две модели с одинаковой точностью могут вести себя принципиально по-разному: одна может проводить гладкую разделяющую границу, другая способна огибать каждый шумовой выброс. Для учебного процесса эта разница принципиальна. Поэтому в основу визуального ядра разрабатываемого инструмента положен анализ решающих поверхностей. Формируется композитное изображение, позволяющее одновременно оценить и структуру данных, и логику работы алгоритма.

Информативность такого представления выходит за рамки простой «картинки». Студент получает возможность напрямую наблюдать, как изменение гиперпараметров трансформирует геометрию решающего правила (рис. 2). Увеличение глубины дерева решений приводит к тому, что гладкая граница начинает дробиться, обрастая изолированными «карманами» – классический признак переобучения. Связь между действием (изменением параметра) и результатом (изменением поверхности) становится прозрачной, что принципиально отличает такой формат от работы со статичными таблицами метрик.

Для задач регрессии описанный выше подход требует модификации, поскольку здесь объектом анализа выступает не разделяющая поверхность, а форма восстанавливаемой зависимости. Прогноз вычисляется вдоль одномерной сетки (по выбранной пользователем оси признакового пространства), после чего строится непрерывная кривая регрессии, на которую накладываются реальные наблюдения (рис. 3). Подобная визуализация дает возможность непосредственно проанализировать масштаб и характер распределения остаточных ошибок. Кроме этого, можно проследить систематические сдвиги, скрытые нелинейные зависимости или, наоборот, избыточную «волнистость» аппроксимирующей кривой, что обычно свидетельствует о переобучении на случайные колебания данных.

Рис. 2. Симулятор настройки гиперпараметров и отображения данных для задачи классификации Примечание: составлен автором по результатам данного исследования

Рис. 3. Симулятор настройки гиперпараметров и отображения данных для задачи регрессии Примечание: составлен автором по результатам данного исследования

Интеграция указанных режимов в одном программном окне формирует рабочую среду, где учебный эксперимент приобретает конкретный, прикладной характер. В таких условиях студент получает возможность поэтапно верифицировать рабочие гипотезы: сопоставлять устойчивость алгоритмов k-ближайших соседей и случайного леса к аномальным наблюдениям, фиксировать точку баланса между недообучением и переобучением при наращивании сложности модели, а также отслеживать влияние выбранной метрики близости на конфигурацию разделяющих границ в задачах классификации. Поддержание непрерывности исследовательского цикла требует минимальных задержек при обработке запросов системой. Для замеров производительности использовались следующие характеристики тестовой системы: процессор Intel Core i5-1135G7 @ 2.40 GHz, оперативная память 16 ГБ DDR4, операционная система Windows 11, версия Python3.10.6. Проведенные замеры показали, что на выборках объемом до 1000 объектов полный цикл, включающий в себя пересчет модели, построение сетки, интерполяцию и перерисовку графики, укладывается в 150 мс. Практически это означает, что задержка становится незаметной для пользователя, и настройка гиперпараметров воспринимается как работа в режиме реального времени, без пауз, разрушающих исследовательский поток.

Для проверки дидактической эффективности предложенного программного решения в учебный процесс был внедрен квазиэкспериментальный дизайн, предполагающий сравнение трех форматов проведения лабораторного занятия. Выбор именно квазиэксперимента обусловлен организационными ограничениями образовательной среды: полная рандомизация участников без нарушения академического расписания невозможна, однако строгий контроль внешних переменных и стандартизация процедур позволяют обеспечить внутреннюю валидность исследования [19]. Экспериментальная часть работы была интегрирована в модуль дисциплины «Машинное обучение», читаемой для студентов 3-го курса направлений технической и информационной подготовки. Общая численность выборки составила 92 чел. Темой занятия была настройка гиперпараметров базовых алгоритмов контролируемого обучения, что соответствует учебному плану и требует от обучающихся перехода от формального применения библиотечных функций к осознанному выбору конфигураций модели.

Формирование учебных групп осуществлялось по принципу стратифицированного распределения. В качестве страт выступали академическая успеваемость за предыдущий семестр (средний балл) и результаты стартового диагностического тестирования, охватывающего базовые понятия теории вероятностей, линейной алгебры и алгоритмизации. Такой подход позволил выровнять группы по уровню исходной подготовки до начала эксперимента.

В зависимости от применяемого инструментария участники были разделены на три потока. Первая группа (n = 31, где n – объем подвыборки) работала в рамках традиционного формата. Обучение строилось на основе лекционного материала и стандартных интерактивных веб-сред, где визуализация результатов носила статический характер. Графики и метрики формировались после завершения обучения модели и требовали ручного запуска ячеек кода. Вторая группа (n = 30) использовала общедоступные интерактивные платформы. Все участники использовали веб-платформу TensorFlow Playground для демонстрации механизмов обучения нейросетей, а также пакет Yellowbrick для графической оценки моделей, построенных в scikit-learn. Подобный подход дает наглядную картину процесса, однако сохраняет зависимость от навыков программирования и не обеспечивает полноценного изучения классических методов машинного обучения. Третья группа (n = 31) работала непосредственно с авторским симулятором.

Чтобы уменьшить влияние сторонних факторов, все группы выполняли строго идентичный комплекс практических заданий. Аппаратное обеспечение компьютерных классов приведено к единому стандарту, благодаря чему различия в вычислительной мощности не могли исказить результаты эксперимента.

Диагностика образовательных достижений реализована через многоуровневую схему, затрагивающую когнитивный, поведенческий и эмоционально-ценностный компоненты учебной деятельности. Изменения в когнитивной сфере отслеживались посредством трехэтапного тестирования. Начальный срез фиксировал исходный уровень владения терминологией, заключительный контроль, проведенный непосредственно по завершении занятия, включал задачи на анализ графиков и аргументацию выбора гиперпараметров, а повторное тестирование через неделю позволяло оценить долговременную сохранность усвоенных концепций [14].

На рис. 4 представлено сравнение групп по ключевым метрикам.

Процессуальные метрики включали хронометраж выполнения лабораторной работы и анализ журналов взаимодействия с программным интерфейсом, в которых фиксировались последовательность изменения параметров, частота возвратов к предыдущим значениям и время принятия решений.

Рис. 4. Сравнение групп по ключевым метрикам Примечание: составлен автором по результатам данного исследования

Рис. 5. Сравнение групп по ключевым метрикам Примечание: составлен автором по результатам данного исследования

Субъективная обратная связь собиралась посредством анкетирования с использованием 5-балльной шкалы Лайкерта. Данное анкетирование представляет собой порядковую шкалу, где респондент выражает степень согласия с утверждением от «полностью не согласен» до «полностью согласен». Вопросы касались наглядности материала, понятности интерфейса и уверенности в интерпретации результатов [11].

На рис. 5 представлена связь удовлетворенности и прироста знаний, а также распределение оценок удовлетворенности по группам.

Обработка полученных массивов данных включала в себя несколько этапов. На первом этапе проверялось соответствие распределений показателей закону нормальности с помощью критерия Шапиро – Уилка. При выполнении условий параметрической статистики прирост учебных достижений оценивался посредством однофакторного дисперсионного анализа (ANOVA). Для локализации значимых межгрупповых различий использовался пост-хок тест через критерий Тьюки, минимизирующий вероятность ошибок первого рода при многократном сравнении. В случаях нарушения предположения о нормальности распределения данных применялся непараметрический критерий Краскела – Уоллиса. Кроме установления статистической значимости, в методику анализа был включен расчет величин эффекта: частичного η² для оценки доли дисперсии, приходящейся на фактор принадлежности к группе, и стандартизированной разности средних для попарных сопоставлений [14, 15]. Такой подход обеспечил комплексную интерпретацию результатов, позволив отделить статистически значимые сдвиги от педагогически релевантных.

Заключение

Результаты исследования подтвердили целесообразность внедрения интерактивного симулятора в учебный процесс как средства формирования компетенций в сфере машинного обучения. Анализ существующих программных сред выявил их ограниченную применимость в образовательном контексте, поскольку профессиональные платформы требуют от обучающихся продвинутой технической подготовки, а узкоспециализированные визуализаторы, как правило, не демонстрируют причинно-следственных связей между изменением гиперпараметров и поведением алгоритма. Указанный недочет обусловил разработку приложения, ориентированного на наглядное моделирование процессов настройки моделей.

Программная реализация выполнена на языке Python с применением фреймворка PyQt5. Архитектура приложения поддерживает работу с широким спектром алгоритмов от базовых линейных методов до ансамблевых моделей. Интерфейс обеспечивает визуальный контроль над ключевыми явлениями, такими как переобучение при увеличении глубины решающего дерева или изменение геометрии границ разделения в алгоритме k-ближайших соседей. В перспективе развития проекта предусмотрена интеграция методов неконтролируемого обучения (кластеризация, снижение размерности), а также модуль интеллектуальной поддержки, генерирующий рекомендации на основе анализа траектории действий обучающегося.

Библиографическая ссылка

Догадина Е.П. СИМУЛЯТОР НАСТРОЙКИ ГИПЕРПАРАМЕТРОВ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ С ДИНАМИЧЕСКОЙ ВИЗУАЛИЗАЦИЕЙ МЕТРИК КАЧЕСТВА КАК СРЕДСТВО ФОРМИРОВАНИЯ ПРОФЕССИОНАЛЬНЫХ КОМПЕТЕНЦИЙ СТУДЕНТОВ ТЕХНИЧЕСКИХ НАПРАВЛЕНИЙ ПОДГОТОВКИ // Современные наукоемкие технологии. 2026. № 5. С. 176-184;
URL: https://top-technologies.ru/en/article/view?id=40791 (дата обращения: 23.07.2026).
DOI: https://doi.org/10.17513/snt.40791

Scientific journal
Modern high technologies

ISSN 1812-7320

"Перечень" ВАК

ИФ РИНЦ = 1,279

HYPERPARAMETER TUNING SIMULATOR FOR MACHINE LEARNING MODELS WITH DYNAMIC VISUALIZATION OF QUALITY METRICS AS A MEANS OF DEVELOPING PROFESSIONAL COMPETENCIES OF STUDENTS IN TECHNICAL FIELDS

Библиографическая ссылка

Modern high technologies
Scientific journal | ISSN 1812-7320 | Certificate - PI №77-15597