ANALYSIS OF POWER SYSTEM MEASUREMENT DATA IN THE CONTEXT OF MACHINE LEARNING

Введение

Производство, передача и распределение электрической энергии осуществляется в электроэнергетических системах, представляющих собой сложные технические объекты, функционирующие в условиях непрерывно изменяющихся режимов работы. Современные электроэнергетические системы характеризуются ростом структурной и режимной сложности, увеличивается доля распределенной генерации и возобновляемых источников энергии, повышаются требования к надежности и качеству электроснабжения. В этих условиях особое значение приобретает точная регистрация параметров режима энергосистемы. Одной из ключевых технологий для решения этой задачи являются синхронизированные векторные измерения (СВИ) [1, с. 14–16] и устройства (УСВИ), построенные на ее основе. Данные СВИ представляют собой совокупность векторных (амплитуда и фаза) и скалярных параметров, измеренных в едином дискретном времени. Сбор и агрегация данных УСВИ производится в системе мониторинга переходных режимов (СМПР). На сегодняшний день СМПР единой энергетической системы (ЕЭС) России включает в себя более тысячи УСВИ, что открывает широкие возможности для исследования больших массивов архивных данных с применением методов машинного обучения [2].

На основе данных СВИ решается широкий круг прикладных задач. К ним относятся мониторинг переходной устойчивости [3] и выявление скрытых аномалий [4]. Активно исследуется поиск низкочастотных колебаний (НЧК) [5; 6]. В [7; 8] рассматривается прогнозирование состояния энергосистемы. Особый практический интерес представляет задача прогнозирования частоты энергосистемы на различных временных горизонтах [9]. В [10] выполняется прогнозирование по некоторым метрикам на дальности в несколько секунд. В [11] рассмотрено прогнозирование на дальности до одного часа с учетом дневных циклов. Восстановление пропущенных фрагментов сигнала описано в [12]. Частота энергосистемы напрямую отражает баланс между генерируемой и потребляемой электроэнергией, она играет ключевую роль в эффективном управлении и защите системы, оценки ее устойчивости и поддержки принятия решений.

Для прогнозирования временных рядов традиционно применяются классические статистические и аналитические методы, такие как линейная регрессия, авторегрессионные модели (ARIMA) [13], спектральные методы и методы продолжения гармонических составляющих. Данные подходы обладают достаточно низкой вычислительной сложностью и хорошей интерпретируемостью, однако их применимость ограничена предположениями о стационарности сигналов и линейности динамики, что не всегда соответствует реальным режимам работы энергосистемы.

В последние годы все более широкое распространение получают методы машинного обучения, в частности нейронные сети, способные учитывать нелинейные и нестационарные зависимости. Для прогнозирования временных рядов применяются сверточные нейронные сети (CNN), рекуррентные архитектуры, включая LSTM [14] и GRU, а также гибридные модели, сочетающие преимущества различных подходов. Данные модели позволяют учитывать сложную динамику частоты, влияние инерционных и регуляторных свойств энергосистемы.

Ключевым этапом построения эффективных моделей прогнозирования временных рядов является предварительный анализ и предобработка исходных данных [15, с. 15–16]. Анализ временных рядов позволяет оценить применимость разрабатываемых моделей машинного обучения к сигналам, а также обеспечить их обобщающую способность. Кроме того, результаты данного этапа важны для последующей валидации метрик точности модели.

Цель исследования – анализ возможности прогнозирования частоты энергосистем разных классов при помощи машинного обучения. Дополнительно проводится краткосрочное прогнозирование в нескольких частотных диапазонах с применением методов различной сложности.

Материалы и методы исследования

В качестве исходных данных рассмотрены суточные сигналы частоты энергосистемы, полученные от УСВИ с двух классов напряжения: внутренней сети офиса (220 В) и высоковольтной линии 500 кВ ЕЭС России, подробно рассмотренной в [10]. Сигналы регистрировались с частотой дискретизации 50 Гц, что соответствует шагу по времени 20 мс (50 измерений в секунду). Длина каждого временного ряда составляет около 4,3 млн отсчетов.

Для анализа были использованы следующие методы: фазовые портреты в разных частотных диапазонах, позволяющие оценить динамическое поведение сигналов; гистограммы плотности распределения для количественной характеристики амплитудной вариативности; амплитудный спектр и спектральная плотность мощности (PSD) для выявления частотного состава и распределения энергии по спектру; стандартное отклонение для оценки вариативности.

Прогнозирование выполнялось с использованием трех подходов различной сложности. В качестве базового метода применялся PREV, в котором прогнозным значением принималось последнее значение входного окна. Метод линейной регрессии (LR) использовался как наиболее распространенный подход для моделирования линейной зависимости между предыдущими значениями сигнала и прогнозным значением. В качестве модели машинного обучения применялась рекуррентная нейронная сеть LSTM. Модель включала в себя два слоя, размерностью 64 и 32 нейрона соответственно. Обучение проводилось на пяти итерациях по исходному набору данных, в качестве функции потерь использовалась метрика MAE.

На рис. 1 представлена схема обучения моделей. Прогнозирование выполнялось для трендовой составляющей (область до 0,1 Гц), области НЧК (от 0,1 до 5 Гц) и диапазона до 5 Гц.

Рис. 1. Схема обучения модели Примечание: составлен авторами на основе источника [10]

Для ускорения вычислений после фильтрации была проведена децимация сигналов. Коэффициент децимации вычислялся по следующей формуле:

где r – частоты дискретизации исходного сигнала, fc – верхняя частота полосы пропускания.

Дальность прогноза в секундах определена как

где n – дальность прогноза, выражаемая в количестве точек.

На первой половине исходного набора данных проводилось обучение модели, на второй – оценка ее точности. На вход модели подавались фрагменты сигнала длительностью 50 с, модель возвращала прогноз на 10 с вперед. Фрагменты формировались с шагом в 5 кадров, что обеспечивало компромисс между объемом и информативностью выборки.

В качестве метрик для оценивания качества моделей использовались метрики Mean Absolute Error (MAE) и коэффициент корреляции Пирсона. Метрика MAE устойчива к выбросам и удобна для интерпретации в исходных единицах данных.

Формула для вычисления MAE:

где yi – спрогнозированное значение, xi – истинное значение, i – индекс наблюдения, n – размер выборки. Коэффициент корреляции Пирсона позволяет оценить согласованность прогнозных значений с истинными и отражает способность модели улавливать тренд и линейную зависимость между переменными. Он определяется как

где xi – истинное значение сигнала, yi – спрогнозированное значение, x и y – средние значения x и y соответственно, n – размер выборки.

Результаты исследования и их обсуждение

На рис. 2 представлены сигналы линии 500 кВ (красный цвет) и сети 220 В (зеленый цвет) в различных частотных областях. В первой колонке приведены исходные сигналы, во второй – сигналы в области НЧК, в последней колонке – трендовая составляющая. В первой строке показаны сигналы во времени, во второй – их фазовые портреты. На оси ординат фазовой плоскости отложена частота, на оси абсцисс – ее производная, обозначаемая как ROCOF.

Рис. 2. Фазовые портреты сигналов Примечание: составлен авторами по результатам данного исследования

Рис. 3. Плотность распределения сигналов Примечание: составлен авторами по результатам данного исследования

Рис. 4. Спектральный анализ исходных сигналов Примечание: составлен авторами по результатам данного исследования

В легендах приведены значения энтропии, вычисленные по формуле Шеннона. Меньшие значения энтропии в диапазоне НЧК указывают на более высокую степень упорядоченности в сравнении с трендом.

На рис. 3 представлен график, отражающий плотность распределения исходных сигналов для тех же фрагментов сигналов. Сигнал (рис. 3, а) более симметричен относительно тренда и характеризуется большим разбросом значений.

На рис. 4 представлены спектральные характеристики исследуемых сигналов за вычетом номинального значения: в верхнем ряду показаны амплитудные спектры, в нижнем ряду – спектральные плотности мощности (PSD). Левый столбец соответствует сигналу сети 220 В, правый – линии 500 кВ.

Таблица 1

Стандартное отклонение сигналов по частотным диапазонам

220 В			500 кВ
0–5 Гц	0–0,1 Гц	0,1–5 Гц	0–5 Гц	0–0,1 Гц	0,1–5 Гц
0,0137	0,0135	0,0028	0,0147	0,0146	0,0015

Примечание: составлена авторами на основе полученных данных в ходе исследования.

Таблица 2

Результаты прогнозирования сигналов

Метод	220 В			500 кВ
Метод	0–5 Гц	0–0,1 Гц	0,1–5 Гц	0–5 Гц	0–0,1 Гц	0,1–5 Гц
PREV	0,004/0	0,004/0	0,003/0	0,003/0	0,004/0	0,002/0
LR	0,003/0,339	0,003/0,245	0,002/0,421	0,003/0,350	0,003/0,191	0,001/0,551
LSTM	0,003/0,384	0,002/0,334	0,001/0,643	0,002/0,376	0,003/0,211	0,001/0,675

Примечание: составлена авторами на основе полученных данных в ходе исследования.

В спектре (рис. 4, а) наблюдается выраженная гребенчатая структура, соответствующая кратным гармоническим составляющим. Спектр (рис. 4, б) характеризуется преобладанием низкочастотных составляющих: амплитуда спектра убывает в диапазоне до 1,5 Гц, тогда как на более высоких частотах амплитуда остается на низком уровне. Основная энергия сигналов сосредоточена в диапазоне до 1 Гц.

В табл. 1 приводятся стандартные отклонения сигналов в различных частотных диапазонах.

В табл. 2 представлены результаты прогнозирования сигналов, выраженные через MAE и коэффициент корреляции Пирсона.

Метод PREV демонстрирует худшие результаты и не учитывает динамику сигнала. Наиболее высокие показатели качества прогноза наблюдаются в области НЧК, что подтверждается меньшим значением стандартного отклонения. LSTM демонстрирует лучшие значения корреляции Пирсона.

Заключение

Машинное обучение становится все более востребованным инструментом в условиях роста сложности современных электроэнергетических систем. В данной работе был проведен анализ влияния частоты энергосистем разных классов на возможность прогнозирования при помощи методов машинного обучения. Статистический анализ показал, что частота высоковольтной линии характеризуется большей стабильностью в сравнении с частотой внутренней сети. Дополнительно была выполнена апробация ряда методов прогнозирования временных рядов на короткий горизонт прогноза. Полученные метрики моделей согласуются с результатами предварительного анализа, что подтверждает его значимость. Наилучшие показатели прогнозирования наблюдаются в области низкочастотных колебаний. Показано, что методы машинного обучения способны эффективно выявлять закономерности во временных рядах и учитывать динамику сигнала, что позволяет использовать данные методы в качестве инструмента для мониторинга и поддержки принятия решений в управлении энергосистемой. Дальнейшее развитие исследования может быть направлено на повышение точности прогнозирования за счет расширения набора входных признаков и модификации архитектуры модели.

Библиографическая ссылка

Угрюмов И. А., Царькова Н. И. АНАЛИЗ ИЗМЕРИТЕЛЬНЫХ ДАННЫХ ЭНЕРГОСИСТЕМ В КОНТЕКСТЕ МАШИННОГО ОБУЧЕНИЯ // Современные наукоемкие технологии. 2026. № 2. С. 85-91;
URL: https://top-technologies.ru/en/article/view?id=40675 (дата обращения: 22.04.2026).
DOI: https://doi.org/10.17513/snt.40675

Scientific journal
Modern high technologies

ISSN 1812-7320

"Перечень" ВАК

ИФ РИНЦ = 1,279

ANALYSIS OF POWER SYSTEM MEASUREMENT DATA IN THE CONTEXT OF MACHINE LEARNING

Библиографическая ссылка

Modern high technologies
Scientific journal | ISSN 1812-7320 | Certificate - PI №77-15597