Введение
Производство, передача и распределение электрической энергии осуществляется в электроэнергетических системах, представляющих собой сложные технические объекты, функционирующие в условиях непрерывно изменяющихся режимов работы. Современные электроэнергетические системы характеризуются ростом структурной и режимной сложности, увеличивается доля распределенной генерации и возобновляемых источников энергии, повышаются требования к надежности и качеству электроснабжения. В этих условиях особое значение приобретает точная регистрация параметров режима энергосистемы. Одной из ключевых технологий для решения этой задачи являются синхронизированные векторные измерения (СВИ) [1, с. 14–16] и устройства (УСВИ), построенные на ее основе. Данные СВИ представляют собой совокупность векторных (амплитуда и фаза) и скалярных параметров, измеренных в едином дискретном времени. Сбор и агрегация данных УСВИ производится в системе мониторинга переходных режимов (СМПР). На сегодняшний день СМПР единой энергетической системы (ЕЭС) России включает в себя более тысячи УСВИ, что открывает широкие возможности для исследования больших массивов архивных данных с применением методов машинного обучения [2].
На основе данных СВИ решается широкий круг прикладных задач. К ним относятся мониторинг переходной устойчивости [3] и выявление скрытых аномалий [4]. Активно исследуется поиск низкочастотных колебаний (НЧК) [5; 6]. В [7; 8] рассматривается прогнозирование состояния энергосистемы. Особый практический интерес представляет задача прогнозирования частоты энергосистемы на различных временных горизонтах [9]. В [10] выполняется прогнозирование по некоторым метрикам на дальности в несколько секунд. В [11] рассмотрено прогнозирование на дальности до одного часа с учетом дневных циклов. Восстановление пропущенных фрагментов сигнала описано в [12]. Частота энергосистемы напрямую отражает баланс между генерируемой и потребляемой электроэнергией, она играет ключевую роль в эффективном управлении и защите системы, оценки ее устойчивости и поддержки принятия решений.
Для прогнозирования временных рядов традиционно применяются классические статистические и аналитические методы, такие как линейная регрессия, авторегрессионные модели (ARIMA) [13], спектральные методы и методы продолжения гармонических составляющих. Данные подходы обладают достаточно низкой вычислительной сложностью и хорошей интерпретируемостью, однако их применимость ограничена предположениями о стационарности сигналов и линейности динамики, что не всегда соответствует реальным режимам работы энергосистемы.
В последние годы все более широкое распространение получают методы машинного обучения, в частности нейронные сети, способные учитывать нелинейные и нестационарные зависимости. Для прогнозирования временных рядов применяются сверточные нейронные сети (CNN), рекуррентные архитектуры, включая LSTM [14] и GRU, а также гибридные модели, сочетающие преимущества различных подходов. Данные модели позволяют учитывать сложную динамику частоты, влияние инерционных и регуляторных свойств энергосистемы.
Ключевым этапом построения эффективных моделей прогнозирования временных рядов является предварительный анализ и предобработка исходных данных [15, с. 15–16]. Анализ временных рядов позволяет оценить применимость разрабатываемых моделей машинного обучения к сигналам, а также обеспечить их обобщающую способность. Кроме того, результаты данного этапа важны для последующей валидации метрик точности модели.
Цель исследования – анализ возможности прогнозирования частоты энергосистем разных классов при помощи машинного обучения. Дополнительно проводится краткосрочное прогнозирование в нескольких частотных диапазонах с применением методов различной сложности.
Материалы и методы исследования
В качестве исходных данных рассмотрены суточные сигналы частоты энергосистемы, полученные от УСВИ с двух классов напряжения: внутренней сети офиса (220 В) и высоковольтной линии 500 кВ ЕЭС России, подробно рассмотренной в [10]. Сигналы регистрировались с частотой дискретизации 50 Гц, что соответствует шагу по времени 20 мс (50 измерений в секунду). Длина каждого временного ряда составляет около 4,3 млн отсчетов.
Для анализа были использованы следующие методы: фазовые портреты в разных частотных диапазонах, позволяющие оценить динамическое поведение сигналов; гистограммы плотности распределения для количественной характеристики амплитудной вариативности; амплитудный спектр и спектральная плотность мощности (PSD) для выявления частотного состава и распределения энергии по спектру; стандартное отклонение для оценки вариативности.
Прогнозирование выполнялось с использованием трех подходов различной сложности. В качестве базового метода применялся PREV, в котором прогнозным значением принималось последнее значение входного окна. Метод линейной регрессии (LR) использовался как наиболее распространенный подход для моделирования линейной зависимости между предыдущими значениями сигнала и прогнозным значением. В качестве модели машинного обучения применялась рекуррентная нейронная сеть LSTM. Модель включала в себя два слоя, размерностью 64 и 32 нейрона соответственно. Обучение проводилось на пяти итерациях по исходному набору данных, в качестве функции потерь использовалась метрика MAE.
На рис. 1 представлена схема обучения моделей. Прогнозирование выполнялось для трендовой составляющей (область до 0,1 Гц), области НЧК (от 0,1 до 5 Гц) и диапазона до 5 Гц.

Рис. 1. Схема обучения модели Примечание: составлен авторами на основе источника [10]
Для ускорения вычислений после фильтрации была проведена децимация сигналов. Коэффициент децимации вычислялся по следующей формуле:

где r – частоты дискретизации исходного сигнала, fc – верхняя частота полосы пропускания.
Дальность прогноза в секундах определена как

где n – дальность прогноза, выражаемая в количестве точек.
На первой половине исходного набора данных проводилось обучение модели, на второй – оценка ее точности. На вход модели подавались фрагменты сигнала длительностью 50 с, модель возвращала прогноз на 10 с вперед. Фрагменты формировались с шагом в 5 кадров, что обеспечивало компромисс между объемом и информативностью выборки.
В качестве метрик для оценивания качества моделей использовались метрики Mean Absolute Error (MAE) и коэффициент корреляции Пирсона. Метрика MAE устойчива к выбросам и удобна для интерпретации в исходных единицах данных.
Формула для вычисления MAE:

где yi – спрогнозированное значение, xi – истинное значение, i – индекс наблюдения, n – размер выборки. Коэффициент корреляции Пирсона позволяет оценить согласованность прогнозных значений с истинными и отражает способность модели улавливать тренд и линейную зависимость между переменными. Он определяется как

где xi – истинное значение сигнала, yi – спрогнозированное значение, x и y – средние значения x и y соответственно, n – размер выборки.
Результаты исследования и их обсуждение
На рис. 2 представлены сигналы линии 500 кВ (красный цвет) и сети 220 В (зеленый цвет) в различных частотных областях. В первой колонке приведены исходные сигналы, во второй – сигналы в области НЧК, в последней колонке – трендовая составляющая. В первой строке показаны сигналы во времени, во второй – их фазовые портреты. На оси ординат фазовой плоскости отложена частота, на оси абсцисс – ее производная, обозначаемая как ROCOF.

Рис. 2. Фазовые портреты сигналов Примечание: составлен авторами по результатам данного исследования

Рис. 3. Плотность распределения сигналов Примечание: составлен авторами по результатам данного исследования

Рис. 4. Спектральный анализ исходных сигналов Примечание: составлен авторами по результатам данного исследования
В легендах приведены значения энтропии, вычисленные по формуле Шеннона. Меньшие значения энтропии в диапазоне НЧК указывают на более высокую степень упорядоченности в сравнении с трендом.
На рис. 3 представлен график, отражающий плотность распределения исходных сигналов для тех же фрагментов сигналов. Сигнал (рис. 3, а) более симметричен относительно тренда и характеризуется большим разбросом значений.
На рис. 4 представлены спектральные характеристики исследуемых сигналов за вычетом номинального значения: в верхнем ряду показаны амплитудные спектры, в нижнем ряду – спектральные плотности мощности (PSD). Левый столбец соответствует сигналу сети 220 В, правый – линии 500 кВ.
Таблица 1
Стандартное отклонение сигналов по частотным диапазонам
|
220 В |
500 кВ |
||||
|
0–5 Гц |
0–0,1 Гц |
0,1–5 Гц |
0–5 Гц |
0–0,1 Гц |
0,1–5 Гц |
|
0,0137 |
0,0135 |
0,0028 |
0,0147 |
0,0146 |
0,0015 |
Примечание: составлена авторами на основе полученных данных в ходе исследования.
Таблица 2
Результаты прогнозирования сигналов
|
Метод |
220 В |
500 кВ |
||||
|
0–5 Гц |
0–0,1 Гц |
0,1–5 Гц |
0–5 Гц |
0–0,1 Гц |
0,1–5 Гц |
|
|
PREV |
0,004/0 |
0,004/0 |
0,003/0 |
0,003/0 |
0,004/0 |
0,002/0 |
|
LR |
0,003/0,339 |
0,003/0,245 |
0,002/0,421 |
0,003/0,350 |
0,003/0,191 |
0,001/0,551 |
|
LSTM |
0,003/0,384 |
0,002/0,334 |
0,001/0,643 |
0,002/0,376 |
0,003/0,211 |
0,001/0,675 |
Примечание: составлена авторами на основе полученных данных в ходе исследования.
В спектре (рис. 4, а) наблюдается выраженная гребенчатая структура, соответствующая кратным гармоническим составляющим. Спектр (рис. 4, б) характеризуется преобладанием низкочастотных составляющих: амплитуда спектра убывает в диапазоне до 1,5 Гц, тогда как на более высоких частотах амплитуда остается на низком уровне. Основная энергия сигналов сосредоточена в диапазоне до 1 Гц.
В табл. 1 приводятся стандартные отклонения сигналов в различных частотных диапазонах.
В табл. 2 представлены результаты прогнозирования сигналов, выраженные через MAE и коэффициент корреляции Пирсона.
Метод PREV демонстрирует худшие результаты и не учитывает динамику сигнала. Наиболее высокие показатели качества прогноза наблюдаются в области НЧК, что подтверждается меньшим значением стандартного отклонения. LSTM демонстрирует лучшие значения корреляции Пирсона.
Заключение
Машинное обучение становится все более востребованным инструментом в условиях роста сложности современных электроэнергетических систем. В данной работе был проведен анализ влияния частоты энергосистем разных классов на возможность прогнозирования при помощи методов машинного обучения. Статистический анализ показал, что частота высоковольтной линии характеризуется большей стабильностью в сравнении с частотой внутренней сети. Дополнительно была выполнена апробация ряда методов прогнозирования временных рядов на короткий горизонт прогноза. Полученные метрики моделей согласуются с результатами предварительного анализа, что подтверждает его значимость. Наилучшие показатели прогнозирования наблюдаются в области низкочастотных колебаний. Показано, что методы машинного обучения способны эффективно выявлять закономерности во временных рядах и учитывать динамику сигнала, что позволяет использовать данные методы в качестве инструмента для мониторинга и поддержки принятия решений в управлении энергосистемой. Дальнейшее развитие исследования может быть направлено на повышение точности прогнозирования за счет расширения набора входных признаков и модификации архитектуры модели.



