Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

APPLICATION OF CONVOLUTIONAL NEURAL NETWORKS FOR DETERMINING CRITICAL FREQUENCIES OF IONOSPHERIC LAYERS

Lytkin F.S. 1 Lytkin S.D. 1
1 North-Eastern Federal University
The aim of the study is to develop and evaluate the effectiveness of a deep learning model for automatic interpretation of ionograms in order to increase the accuracy of determining the parameters of the ionosphere layers compared with traditional analysis methods. The article presents a technique for automatic interpretation of ionograms using deep machine learning. To train and test the model, ionogram data obtained using a vertical sounding ionosonde were used. The station, located in Yakutsk and part of the global network of ionospheric stations, provided long-term observations necessary to create a reliable and representative sample. The proposed method is based on convolutional neural networks that are able to effectively identify features in ionogram images, which makes it possible to automate the process and increase the accuracy of forecasting extreme values of the ionosphere. The model trained on the selected set of ionograms demonstrated a prediction accuracy of 82,17%. The results showed that the use of machine learning methods, in particular deep learning, significantly increases the efficiency of ionogram interpretation compared to traditional methods. The data obtained confirm the prospects of using the proposed approach in scientific and practical tasks of automating the analysis of ionospheric data.
сonvolutional neural networks
ionogram interpretation
ionosphere
deep machine learning

Введение

Ионосфера – это верхний слой атмосферы Земли, состоящий из заряженных частиц и свободных электронов. Она играет ключевую роль в обеспечении радиосвязи на большие расстояния благодаря способности отражать радиоволны обратно на Землю [1]. Одним из основных методов изучения ионосферы является вертикальное зондирование, результатом которого становятся ионограммы (рис. 1) – графические представления зависимости высоты отражения радиосигнала от его частоты [2].

Поскольку существующие методы автоматизации имеют низкую точность [3], эксперты выполняют разметку ионограмм вручную – это трудоемкий процесс, который подвержен человеческому фактору, в результате могут иметь место ошибки. В связи с увеличением объемов данных и необходимостью повышения точности анализа задача автоматизации этого процесса становится особенно актуальной. Традиционно интерпретация этих данных выполняется вручную или с использованием полуавтоматических алгоритмов, таких как ARTIST (Automatic Real-Time Ionogram Scaler with True Height).

missing image file

Рис. 1. Ионограмма, полученная в Якутске со станции YA462

Однако такие методы часто ошибаются, а также имеют низкую точность в сложных случаях. Например, ARTIST демонстрирует значительный уровень ошибок при определении слоя F1, включая ложные отрицательные результаты и пропуски наблюдаемых случаев [4]. Применение методов машинного обучения, особенно глубокого обучения, могло бы значительно улучшить точность анализа и автоматизировать процесс, снижая вероятность ошибок.

В последние годы было опубликовано несколько исследований, демонстрирующих успешное применение методов машинного обучения, особенно глубокого обучения, для анализа ионограмм [5, 6]. Преимущества глубокого обучения и сверточных нейронных сетей (CNN) были доказаны в различных задачах анализа данных и изображений, включая обработку ионограмм [7]. Исследования показывают, что CNN способны автоматически выделять признаки на изображениях, такие как слои ионосферы, что значительно упрощает процесс интерпретации и повышает точность анализа. Например, в работе Zheng Wang и соавторов был разработан метод автоматического анализа ионограмм и обнаружения ионосферных явлений с использованием глубокого обучения. Исследование базировалось на данных, собранных ионозондом на станции Хайнань за 14 лет (2002–2016), включавших более 500 000 изображений [5]. В нем применили современные модели глубокого обучения, такие как ResNet и EfficientNet, которые продемонстрировали точность обнаружения ионосферных явлений более 97%. Предложенный подход, основанный исключительно на анализе визуальных признаков изображений, оказался более универсальным и эффективным по сравнению с традиционными методами обработки данных, и не зависящим от формата данных или параметров оборудования. Кроме того, в исследовании, проведенном Phongsachot Benchawattananon, были сравнены два метода машинного обучения – сверточные нейронные сети и машины опорных векторов (SVM) – для автоматической классификации ионограмм. Результаты показали, что CNN достигли наивысшей точности классификации – до 92,9% – благодаря способности автоматически выделять значимые признаки на изображениях. SVM, в свою очередь, продемонстрировали точность до 87,0%, показывая лучшие результаты при работе с небольшими выборками данных. Сравнение этих методов подтвердило, что CNN являются более универсальным и эффективным инструментом для анализа ионограмм, особенно при наличии большого объема данных, в то время как SVM остаются надежным вариантом для задач с ограниченными наборами данных [6]. В другом исследовании, проведенном С.А. Долгачевой и соавторами, была разработана модель на основе сверточных нейронных сетей для автоматической интерпретации высокоширотных ионограмм CADI [8]. Используя данные из 283 901 ионограммы для обучения и 60 626 для тестирования, модели достигли точности определения слоев ионосферы до 91%. Средняя абсолютная ошибка для частот варьировалась от 0,27 до 0,66 МГц, а для высот – от 6,2 до 32 км. Это исследование подтвердило потенциал CNN в автоматизации анализа данных высокоширотной ионосферы, что позволит значительно сократить трудозатраты при ручной обработке и повысить точность интерпретации.

Цели исследования – разработка и оценка эффективности модели глубокого обучения для автоматической интерпретации ионограмм с целью повышения точности определения параметров ионосферных слоев по сравнению с традиционными методами анализа.

Материал и методы исследования

Для обучения и тестирования модели использовались данные ионограмм, полученные с помощью ионозонда вертикального зондирования DPS4. Станция, расположенная в Якутске и входящая в мировую сеть ионосферных станций под кодом YA462, обеспечила многолетний объем наблюдений, необходимых для создания надежной и репрезентативной выборки. Использование такой базы данных обусловливает высокую достоверность результатов, так как она охватывает различные условия ионосферной активности, включая сезонные и суточные изменения. Эти ионограммы представляют собой графические зависимости времени задержки радиосигналов, отраженных от слоев ионосферы, от их частоты. Изначально данные хранились в двоичном формате GRM, который был преобразован в удобный для анализа вид. Этот процесс включал извлечение необходимых параметров и последующее представление данных в виде изображений. Ионограммы были представлены в виде изображений фиксированного размера, где каждая точка соответствует частотно-высотной характеристике сигнала. Размеры изображений были уменьшены до 128×128 пикселей и сохранены в градациях серого, что позволило сохранить важные особенности исходных данных, такие как амплитуда сигнала и поляризация сигнала в виде O-поляризации и X-поляризации (рис. 2).

Горизонтальная ось соответствует частоте сигнала, а вертикальная ось – высоте отражения. После анализа имеющихся ионограмм было решено установить максимальные значения на 7 МГц по горизонтали и 700 км по вертикали, чтобы отбросить пустые зоны. Были отфильтрованы значения амплитуды, оставлены только значимые сигналы в диапазоне от 6 до 23 дБ. Для обучения модели были выбраны ионограммы с вручную размеченными слоями E, F1, F2. Для каждого слоя отмечались два параметра: начало и конец. Пример разметки трех слоев можно увидеть на рисунке 3.

missing image file

Рис. 2. Стандартизированное изображение ионограммы

Для автоматической интерпретации ионограмм использовалась сверточная нейронная сеть, оптимизированная для задач выделения особенностей на изображениях. Для разработки и обучения модели была выбрана библиотека TensorFlow вследствие ее широкого распространения и наличия обширной документации и литературы. Архитектура модели была разработана таким образом, чтобы эффективно обрабатывать двумерные данные частотно-высотной зависимости, выделяя параметры ионосферных слоев. Оптимальные параметры модели, такие как размер ядра свертки, количество фильтров и глубина сети, были определены после серии тестов. Архитектура разработанной модели включает входной слой, несколько сверточных блоков и финальные полносвязные слои, что позволяет эффективно выделять ключевые признаки ионосферных слоев. Входной слой модели принимает изображения фиксированного размера 128×128 пикселей с одним каналом (градации серого). Для извлечения признаков используются пять сверточных блоков, каждый из которых включает сверточный слой (Conv2D) с ядром размера 3×3, функцию активации ReLU, нормализацию пакетов (BatchNormalization), которая способствует улучшению устойчивости и ускорению обучения, а также слой подвыборки (MaxPooling2D), уменьшающий размерность данных при сохранении их основных характеристик. В каждом последующем блоке увеличивается количество фильтров: 16, 32, 64, 128 и 256, что позволяет извлекать как общие, так и более детализированные признаки.

missing image file

Рис. 3. Визуализация разметки слоев E, F1, F2 на ионограмме

Для предотвращения переобучения используется слой Dropout, который помогает улучшить обобщающие способности модели. На выходе модель предсказывает шесть параметров, соответствующих частотам начала и конца экстремумов слоев E, F1 и F2. В процессе обучения отслеживалась динамика функции потерь на обучающей и валидационной выборках. За 40 эпох модель достигла стабильной сходимости, при этом средняя абсолютная ошибка (MAE) демонстрировала устойчивое снижение.

Для оптимизации обучения использовался алгоритм Adam (Adaptive Moment Estimation) с начальной скоростью обучения 0,001. В качестве функции потерь применялась средняя абсолютная ошибка для каждого из выходов. Для улучшения обучения и предотвращения застывания модели на плато использовался алгоритм ReduceLROnPlateau, который снижал скорость обучения при отсутствии улучшения метрики валидации.

Результаты исследования и их обсуждение

Модель, основанная на сверточной нейронной сети, была обучена на выборке из 2679 ионограмм. Результаты оценки модели показали, что она способна достаточно точно предсказывать экстремумы слоев ионосферы. MAE для слоя E составила 0,14 МГц для начального экстремума и 0,19 МГц для конечного, что можно объяснить четкой выраженностью этих слоев на большинстве ионограмм. Для слоя F1, который часто сложнее различить из-за его слабой выраженности, ошибка составила 0,24 МГц (начало) и 0,23 МГц (конец). Это подтверждает, что модель способна обрабатывать даже менее выраженные слои, хотя точность в таких случаях может быть ниже. Слой F2, являющийся более выраженным, дал меньшую ошибку: 0,24 МГц (начало) и 0,20 МГц (конец). Несмотря на то что ошибка при определении слоя F1 выше, чем для остальных слоев, процесс его обучения происходит быстрее. Это подтверждается графиками изменения функции потерь в зависимости от количества эпох, представленными на рисунке 4. Возможно, это связано с тем, что параметры слоя F1 демонстрируют большую стабильность.

Общая точность модели составила 82,17% (табл. 1), что значительно лучше по сравнению с традиционными методами, такими как ARTIST. Это подтверждает эффективность использования сверточных нейронных сетей для автоматической интерпретации ионограмм. В процессе обучения и оценки модели отслеживались метрики в виде средней абсолютной ошибки в мегагерцах. Визуальный анализ предсказаний показал, что модель корректно определяет экстремумы слоев ионосферы, даже в случаях с частично выраженными или шумными данными. Например, для стандартных ионограмм с четкими кривыми предсказанные параметры практически полностью совпадают с реальными значениями. В редких случаях, где наблюдаются отклонения, они связаны с низкой амплитудой сигнала или наличием значительного шума. Проведенные тесты подтвердили, что предложенный метод подходит для решения задачи автоматической интерпретации ионограмм и может быть использован для дальнейших исследований.

Можно провести сравнение только с данными из статьиС.А. Долгачевой с соавт. [8], поскольку статья Phongsachot Benchawattananon с соавт. [6] решает совсем другую задачу – классификацию явления Spread-F. Параметры E_end, F1_end и F2_end в модели авторов соответствуют параметрам foE, foF1 и foF2 в статье СА. Долгачевой с соавт. [8].

Модель авторов исследования демонстрирует более высокую точность, что может быть обусловлено рядом факторов (табл. 2).

missing image file

Рис. 4. Графики потерь от количества эпох для каждого слоя

Таблица 1

Точность предсказания параметров слоев ионосферы

 

Абсолютная средняя ошибка (МГц)

Абсолютная средняя ошибка в процентах (%)

Точность прогноза (%)

E_start

0,1358

1,94

98,06

E_end

0,1939

2,77

97,23

F1_start

0,2345

3,35

96,65

F1_end

0,2401

3,43

96,57

F2_start

0,2359

2,97

97,03

F2_end

0,2079

3,37

96,63

Суммарный результат

1,2481

17,83

82,17

Таблица 2

Сравнение результатов

Параметр

MAE модели авторов (МГц)

MAE в статье С.А. Долгачевой с соавт. (МГц)

Accuracy модели авторов (%)

Accuracy в статье С.А. Долгачевой с соавт. (%)

E_end (foE)

0,1939

0,39

97,23

88

F1_end (foF1)

0,2401

0,43

96,57

91

F2_end (foF2)

0,2079

0,4

96,63

89

Во-первых, различия в данных могут объясняться географическим расположением станций, так как они находятся в разных точках Земли и фиксируют разные условия ионосферной активности. Во-вторых, влияние могли оказать особенности архитектуры и параметров самой модели, включая используемые методы предобработки данных, выбор гиперпараметров и алгоритмы оптимизации. Эти факторы в совокупности могли способствовать улучшению точности прогнозирования параметров ионосферы в предложенной модели.

Для сравнения также следует упомянуть алгоритм ARTIST, который широко используется для автоматической обработки ионограмм. Известно, что ARTIST демонстрирует высокую точность при обработке ионограмм, полученных в средних широтах, достигая более 90% [4]. Однако точность значительно уменьшается в районах, близких к северному полярному кругу. Это связано с особенностями поведения ионосферы в этих высокоширотных областях, где структура ионосферных слоев становится более сложной.

В отличие от ARTIST, модель авторов, обученная на репрезентативных данных станции YA462, демонстрирует существенно более высокую точность, что подтверждается значениями MAE для параметров E_end, F1_end и F2_end. Это свидетельствует о том, что предложенный подход способен эффективно учитывать региональные особенности ионосферы и обеспечивать более надежную интерпретацию ионограмм.

Заключение

Разработана модель глубокого обучения для автоматической интерпретации ионограмм и определена ее точность. Полученные результаты подтверждают, что нейросети могут быть эффективным инструментом для автоматизации процесса анализа ионограмм, позволяя значительно ускорить интерпретацию и повысить точность по сравнению с традиционными методами. Несмотря на достигнутую точность, модель имеет ограничения, связанные с обработкой аномальных данных и влиянием шума на результаты. Для дальнейшего улучшения точности необходимо расширить обучающий набор данных, а также исследовать возможности использования более сложных архитектур нейронных сетей. В перспективе разработанный метод может быть интегрирован в существующие системы анализа ионограмм, что позволит улучшить процесс интерпретации данных и повысить качество прогноза характеристик ионосферы.