Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

BUILDING AN ALGORITHM FOR INTELLIGENT ANALYSIS OF BEHAVIORAL CLASSIFIERS FOR TRAINING PERSONALIZATION

Tlegenova T.E. 1 Shardakov V.M. 1
1 Orenburg State University
In the context of active development of e-learning, one of the key areas of modern research is the personalization of education. Personalized learning allows you to adapt the educational process to a specific student, which maximally individualizes their educational needs, cognitive styles and career aspirations. In order to optimize a personalized learning system, the authors suggest using data mining to detect hidden patterns, relationships, and rules for analyzing, classifying, and predicting learning outcomes. In particular, the paper proposes to analyze the behavioral characteristics of students obtained from the results of a preliminary survey in order to detect hidden information in the results obtained through data mining, for which an algorithm for the intellectual analysis of behavioral classifiers has been developed for personalization of training. Thus, the range of functional tasks solved by data mining technologies is extremely wide, ranging from planning and conducting independent work of students to developing competencies. The key tasks in developing a data mining algorithm for personalized learning are: developing input content, building a normative model for the learner, and designing a mathematical model. To solve each of these tasks, it is necessary to formalize the input set of parameters, develop a subsystem for defining pedagogical methods and principles that allows you to build personalized learning. Using the developed data analysis algorithm, the authors predict the final grades of students and students at risk of failure.
data analysis
personalized learning
learners
intelligence
efficiency

Развитие электронного обучения обозначено как обязательная составляющая формирования информационного пространства знаний в соответствии с Указом Президента РФ «О Стратегии развития информационного общества в Российской Федерации на 2017–2030 годы» [1].

В условиях активного развития электронного обучения одним из ключевых направлений современных исследований является персонализация образования. Персонализированное обучение позволяет адаптировать образовательный процесс под конкретного студента, что максимально индивидуализирует его образовательные потребности, когнитивные стили и карьерные устремления.

Все большее количество образовательных учреждений во всём мире принимает тенденцию персонализации обучения, используя, как один из методов, интеллектуальный анализ данных.

Посредством применения интеллектуального анализа данных становится возможно обнаружение скрытых шаблонов, отношений и правил для анализа, классификации и прогнозирования в различных реальных условиях при персонализации обучения.

Так, исследователи из Шанхая предложили архитектуру персонализированной системы электронного обучения с применением кластерного подхода. Система электронного обучения обнаруживает и реагирует на содержание обучения в соответствии с когнитивными возможностями студентов и разделяет учащихся на различные группы или кластеры на основе их учебного поведения. На основе проведенного анализа методов кластеризации (K-средние, K-Medoids, DBSCAN, агломеративное иерархическое дерево кластеров, кластеризация путем быстрого поиска и нахождения пиков плотности (CFSFDP) было отмечено, что более надежные результаты могут быть достигнуты методом CFSFDP [2].

W. Villegas-Ch и S. Lujan-Mora провели анализ методов интеллектуального анализа данных для персонализированного обучения, для повышения эффективности и результативности обучения, путем выявления закономерностей в успеваемости учащихся, данные предлагается извлекать из систем управления обучением (LMS), в частности платформы электронного обучения Moodle. Данные из этих систем могут быть оценены и преобразованы в полезную информацию с целью индивидуализировать образование и приспособить к потребностям каждого учащегося [3].

Группа ученых под руководством A. Segal представили новый подход к персонализации образовательного процесса на основе алгоритма EduRank, сочетающего в себе коллаборативную фильтрацию на основе метода ближайших соседей с методом ранжирования социальных предпочтений. EduRank строит рейтинг сложности для каждого учащегося, объединяя рейтинги похожих учеников, используя различные аспекты их успеваемости. Алгоритм был протестирован на двух наборах данных, содержащих тысячи студентов и миллион записей, и смог превзойти современные методы ранжирования, а также эксперта по предметной области [4].

В работе [5] авторы предлагают персонализированную модель электронного обучения на основе сервисно-ориентированной архитектуры, позволяющей учитывать особенности обучаемого, его профиль, и используют метод коллаборативной фильтрации для системы прогнозирования. В предлагаемой адаптивной системе применяется компетентностный подход, цель которого адаптировать индивидуальную траекторию обучения к характеристикам обучаемого, что в конечном итоге позволит приобрести желаемые компетенции.

Группа ученых [6] разработала новую модель рекомендации персонализированного пути обучения, основанную на методах кластеризации и машинного обучения. Основываясь на метрике сходства признаков учащихся, формируют группу и обучают на основе модели сети долгой краткосрочной памяти (LSTM), чтобы предсказать их пути обучения и производительность. Затем из результатов прогнозирования пути выбираются персонализированные пути обучения. Экспериментальные результаты показывают, что предлагаемые авторами методы дают надежные рекомендации по соответствующим путям обучения со значительно улучшенными результатами обучения с точки зрения точности и эффективности.

Цель исследования: разработка алгоритма интеллектуального анализа поведенческих классификаторов посредством оптимизации производительности персонализированной системы обучения.

Материалы и методы исследования

Нами была предложена модель процесса обучения, в которой все вычисления основываются на процентном соотношении компетенций, формируемых в высшем учебном заведении: универсальные (UK), общепрофессиональные (OPK) и профессиональные (PK). Данные соотношения можно представить в следующем виде:

tleganov01.wmf (1)

Весовые коэффициенты выявлены посредством опроса предприятий и организаций. В данном опросе каждому представителю предприятия направлялась анкета, в которой необходимо было отметить ключевые факторы, которые необходимы предприятию при найме специалиста на работу.

Соотношение весовых коэффициентов UK, OPK, PK определяется при входном тестировании обучающихся. Каждый коэффициент определяется в диапазоне [0, 100]. Данный подход позволяет определить уровень подготовки студента.

К примеру, обучающийся может быть отличником по универсальным дисциплинам, но прогнозируемая оценка по дисциплинам, относящимся к профессиональной компетенции, у него может быть удовлетворительной, поэтому следующим шагом определим возможный класс обучающегося K:

tleganov02.wmf (2)

В соответствии с формулой (2) можно сделать вывод, что если обучающийся набрал менее 55 баллов, то он относится к классу D, т.е. к потенциальным студентам, которые не сдадут экзамен ни по одной дисциплине, относящейся к определенным компетенциям. Рекомендациями разработанной авторами системы будет являться необходимость дополнительных занятий для такого обучающегося и предоставление дополнительных методических материалов. При получении баллов обучающимся в диапазоне [55, 70] его можно отнести к классу С. Средний прогнозируемый уровень освоения компетенций является удовлетворительным. Рекомендациями такому классу обучающихся будет являться предоставление дополнительных материалов для изучения. К классу В отнесены значения, набранные в диапазоне [70, 90]. Уровень усвоения компетенций приравнивается к отметке «Хорошо». Для обучающихся данного класса возможны дополнительные разъяснения по определенной компетенции.

Обучающиеся, набравшие баллы в диапазоне [90, 100], приравниваются к классу А, и прогнозируется, что уровень освоения компетенций у обучающихся является отличным.

Средняя погрешность, которая возможна при определении класса обучающегося, представлена среднеквадратическим отклонением каждого из возможных результатов тестирования:

tleganov03.wmf (3)

где Si – среднеквадратичное отклонение на интервале i, оно находится для каждого из возможных результатов по формуле:

tleganov04.wmf (4)

Sk – среднеквадратичное отклонение результата тестирования, которое вычисляется по формуле:

tleganov05.wmf (5)

xi – результат тестирования, tleganov06.wmf – среднее значение между минимальным и максимальным оцениванием, n – количество результатов тестирования с оценкой k.

На основе описанной модели авторами разработан алгоритм интеллектуального анализа поведенческих классификаторов при персонализации обучения, который показан на рис. 1.

tleg1.tif

Рис. 1. Алгоритм интеллектуального анализа поведенческих классификаторов при персонализации обучения

Начальным значением, которое получает система для обработки информации, является проведенное преподавателем входное тестирование. Посредством обработанной информации определяются компетенции: универсальные, общепрофессиональные и профессиональные. Следующим этапом является определение его класса (диапазон значения является принятым для пороговых оценок в Оренбургском государственном университете). Считаем, что студентам класса C и D для успешной сдачи дисциплин в обязательном порядке необходимо предоставлять дополнительный материал и проводить дополнительные занятия. После прохождения дополнительных занятий обучающиеся проходят новое тестирование. Классу В предоставлен выбор, желают ли они подтянуть свои знания, чтобы перейти в класс А, который считается, что обучающийся в нём знает более 90 процентов материала.

Результаты исследования и их обсуждение

Для того чтобы получить значения P, авторами работы было проведено входное тестирование обучающихся посредством Гугл-формы (рис. 2), с помощью которого определены значения UK, OPK, PK.

Итоговые результаты экспортируются в формат Microsoft Excel, с указанием номера зачетной книжки и баллов после прохождения тестирования по всем компетенциям и соотношения компетенций. Результаты входного тестирования показаны на рис. 3.

tleg2.tif

Рис. 2. Пример разработанных тестов

tleg3.tif

Рис. 3. Результаты входного тестирования

tleg4.tif

Рис. 4. Результаты повторного тестирования

tleg5.tif

Рис. 5. График изменения академической успеваемости группы

Согласно каждому классу в зависимости от тех компетенций, которые вызывают проблему, авторами разработаны методические рекомендации, соответствующие определенному классу обучающихся. После чего проводится новое тестирование для обучающихся класса C, D и для изъявивших желание обучающихся класса B. На рис. 4 представлены результаты изменения уровней освоения универсальных, общепрофессиональных и профессиональных компетенций.

В ходе эксперимента наблюдалась положительная динамика изменения академической успеваемости студентов, представленная на рис. 5.

Заключение

В представленной работе проведен интеллектуальный анализ данных посредством применения персонализированного обучения, акцентируя внимание на образовательные компетенции. Входными данными являются характеристики студентов, полученные в результате предварительного тестирования посредством оценки уровня их компетентности. На основе полученных значений и разработанного алгоритма анализа данных можно получить классификаторы студентов, с помощью которых каждого студента предварительно система относит к определенной группе: отличников (A) или к группе студентов, которым необходимо серьезно улучшить свои знания (D). Разработаны методические рекомендации для студентов и показаны результаты эффективности предложенного метода. Используя разработанный алгоритм анализа данных, авторы прогнозируют итоговые оценки студентов и тех, кто рискует провалить экзамен. Полученные результаты свидетельствуют о повышении эффективности процесса обучения, ориентированного на формирование образовательных компетенций посредством применения интеллектуального анализа данных, и рекомендованы для внедрения при построении и планировании образовательной программы.