Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,279

ANALYSIS OF POWER SYSTEM MEASUREMENT DATA IN THE CONTEXT OF MACHINE LEARNING

Ugryumov I. A. 1 Tsarkova N. I. 1
1 Federal State Autonomous Educational Institution of Higher Education “Moscow Polytechnic University”
1881 KB
The increasing complexity of modern power systems raises the requirements for the reliability and quality of electricity supply. A significant role in addressing this challenge is played by the technology of synchronized phasor measurements, which allows registering power system parameters with high accuracy, resulting in large volumes of measurement data and enabling their analysis and utilization. One of the key indicators of power system operation is its frequency. The aim of this study is to analyze the possibility of forecasting the frequency of power systems of different classes using machine learning. The work examines daily frequency signals from networks of different voltage classes: the 220 V internal network and the 500 kV high-voltage line of the Russian Unified Energy System. A preliminary analysis of the time series is conducted, identifying features of their variability and spectral composition, followed by short-term forecasting in various frequency ranges using methods of different complexity. The obtained model metrics are consistent with the results of the preliminary analysis, confirming its significance. It is shown that machine learning methods can effectively capture patterns in time series and account for signal dynamics, making these methods a useful tool for monitoring and supporting decision-making in power system management.
power systems
synchronized phasor measurements
time series forecasting
machine learning
neural networks

Введение

Производство, передача и распределение электрической энергии осуществляется в электроэнергетических системах, представляющих собой сложные технические объекты, функционирующие в условиях непрерывно изменяющихся режимов работы. Современные электроэнергетические системы характеризуются ростом структурной и режимной сложности, увеличивается доля распределенной генерации и возобновляемых источников энергии, повышаются требования к надежности и качеству электроснабжения. В этих условиях особое значение приобретает точная регистрация параметров режима энергосистемы. Одной из ключевых технологий для решения этой задачи являются синхронизированные векторные измерения (СВИ) [1, с. 14–16] и устройства (УСВИ), построенные на ее основе. Данные СВИ представляют собой совокупность векторных (амплитуда и фаза) и скалярных параметров, измеренных в едином дискретном времени. Сбор и агрегация данных УСВИ производится в системе мониторинга переходных режимов (СМПР). На сегодняшний день СМПР единой энергетической системы (ЕЭС) России включает в себя более тысячи УСВИ, что открывает широкие возможности для исследования больших массивов архивных данных с применением методов машинного обучения [2].

На основе данных СВИ решается широкий круг прикладных задач. К ним относятся мониторинг переходной устойчивости [3] и выявление скрытых аномалий [4]. Активно исследуется поиск низкочастотных колебаний (НЧК) [5; 6]. В [7; 8] рассматривается прогнозирование состояния энергосистемы. Особый практический интерес представляет задача прогнозирования частоты энергосистемы на различных временных горизонтах [9]. В [10] выполняется прогнозирование по некоторым метрикам на дальности в несколько секунд. В [11] рассмотрено прогнозирование на дальности до одного часа с учетом дневных циклов. Восстановление пропущенных фрагментов сигнала описано в [12]. Частота энергосистемы напрямую отражает баланс между генерируемой и потребляемой электроэнергией, она играет ключевую роль в эффективном управлении и защите системы, оценки ее устойчивости и поддержки принятия решений.

Для прогнозирования временных рядов традиционно применяются классические статистические и аналитические методы, такие как линейная регрессия, авторегрессионные модели (ARIMA) [13], спектральные методы и методы продолжения гармонических составляющих. Данные подходы обладают достаточно низкой вычислительной сложностью и хорошей интерпретируемостью, однако их применимость ограничена предположениями о стационарности сигналов и линейности динамики, что не всегда соответствует реальным режимам работы энергосистемы.

В последние годы все более широкое распространение получают методы машинного обучения, в частности нейронные сети, способные учитывать нелинейные и нестационарные зависимости. Для прогнозирования временных рядов применяются сверточные нейронные сети (CNN), рекуррентные архитектуры, включая LSTM [14] и GRU, а также гибридные модели, сочетающие преимущества различных подходов. Данные модели позволяют учитывать сложную динамику частоты, влияние инерционных и регуляторных свойств энергосистемы.

Ключевым этапом построения эффективных моделей прогнозирования временных рядов является предварительный анализ и предобработка исходных данных [15, с. 15–16]. Анализ временных рядов позволяет оценить применимость разрабатываемых моделей машинного обучения к сигналам, а также обеспечить их обобщающую способность. Кроме того, результаты данного этапа важны для последующей валидации метрик точности модели.

Цель исследования – анализ возможности прогнозирования частоты энергосистем разных классов при помощи машинного обучения. Дополнительно проводится краткосрочное прогнозирование в нескольких частотных диапазонах с применением методов различной сложности.

Материалы и методы исследования

В качестве исходных данных рассмотрены суточные сигналы частоты энергосистемы, полученные от УСВИ с двух классов напряжения: внутренней сети офиса (220 В) и высоковольтной линии 500 кВ ЕЭС России, подробно рассмотренной в [10]. Сигналы регистрировались с частотой дискретизации 50 Гц, что соответствует шагу по времени 20 мс (50 измерений в секунду). Длина каждого временного ряда составляет около 4,3 млн отсчетов.

Для анализа были использованы следующие методы: фазовые портреты в разных частотных диапазонах, позволяющие оценить динамическое поведение сигналов; гистограммы плотности распределения для количественной характеристики амплитудной вариативности; амплитудный спектр и спектральная плотность мощности (PSD) для выявления частотного состава и распределения энергии по спектру; стандартное отклонение для оценки вариативности.

Прогнозирование выполнялось с использованием трех подходов различной сложности. В качестве базового метода применялся PREV, в котором прогнозным значением принималось последнее значение входного окна. Метод линейной регрессии (LR) использовался как наиболее распространенный подход для моделирования линейной зависимости между предыдущими значениями сигнала и прогнозным значением. В качестве модели машинного обучения применялась рекуррентная нейронная сеть LSTM. Модель включала в себя два слоя, размерностью 64 и 32 нейрона соответственно. Обучение проводилось на пяти итерациях по исходному набору данных, в качестве функции потерь использовалась метрика MAE.

На рис. 1 представлена схема обучения моделей. Прогнозирование выполнялось для трендовой составляющей (область до 0,1 Гц), области НЧК (от 0,1 до 5 Гц) и диапазона до 5 Гц.

Рис. 1. Схема обучения модели Примечание: составлен авторами на основе источника [10]

Для ускорения вычислений после фильтрации была проведена децимация сигналов. Коэффициент децимации вычислялся по следующей формуле:

где r – частоты дискретизации исходного сигнала, fc – верхняя частота полосы пропускания.

Дальность прогноза в секундах определена как

где n – дальность прогноза, выражаемая в количестве точек.

На первой половине исходного набора данных проводилось обучение модели, на второй – оценка ее точности. На вход модели подавались фрагменты сигнала длительностью 50 с, модель возвращала прогноз на 10 с вперед. Фрагменты формировались с шагом в 5 кадров, что обеспечивало компромисс между объемом и информативностью выборки.

В качестве метрик для оценивания качества моделей использовались метрики Mean Absolute Error (MAE) и коэффициент корреляции Пирсона. Метрика MAE устойчива к выбросам и удобна для интерпретации в исходных единицах данных.

Формула для вычисления MAE:

где yi – спрогнозированное значение, xi – истинное значение, i – индекс наблюдения, n – размер выборки. Коэффициент корреляции Пирсона позволяет оценить согласованность прогнозных значений с истинными и отражает способность модели улавливать тренд и линейную зависимость между переменными. Он определяется как

где xi – истинное значение сигнала, yi – спрогнозированное значение, x и y – средние значения x и y соответственно, n – размер выборки.

Результаты исследования и их обсуждение

На рис. 2 представлены сигналы линии 500 кВ (красный цвет) и сети 220 В (зеленый цвет) в различных частотных областях. В первой колонке приведены исходные сигналы, во второй – сигналы в области НЧК, в последней колонке – трендовая составляющая. В первой строке показаны сигналы во времени, во второй – их фазовые портреты. На оси ординат фазовой плоскости отложена частота, на оси абсцисс – ее производная, обозначаемая как ROCOF.

Рис. 2. Фазовые портреты сигналов Примечание: составлен авторами по результатам данного исследования

Рис. 3. Плотность распределения сигналов Примечание: составлен авторами по результатам данного исследования

Рис. 4. Спектральный анализ исходных сигналов Примечание: составлен авторами по результатам данного исследования

В легендах приведены значения энтропии, вычисленные по формуле Шеннона. Меньшие значения энтропии в диапазоне НЧК указывают на более высокую степень упорядоченности в сравнении с трендом.

На рис. 3 представлен график, отражающий плотность распределения исходных сигналов для тех же фрагментов сигналов. Сигнал (рис. 3, а) более симметричен относительно тренда и характеризуется большим разбросом значений.

На рис. 4 представлены спектральные характеристики исследуемых сигналов за вычетом номинального значения: в верхнем ряду показаны амплитудные спектры, в нижнем ряду – спектральные плотности мощности (PSD). Левый столбец соответствует сигналу сети 220 В, правый – линии 500 кВ.

Таблица 1

Стандартное отклонение сигналов по частотным диапазонам

220 В

500 кВ

0–5 Гц

0–0,1 Гц

0,1–5 Гц

0–5 Гц

0–0,1 Гц

0,1–5 Гц

0,0137

0,0135

0,0028

0,0147

0,0146

0,0015

Примечание: составлена авторами на основе полученных данных в ходе исследования.

Таблица 2

Результаты прогнозирования сигналов

Метод

220 В

500 кВ

0–5 Гц

0–0,1 Гц

0,1–5 Гц

0–5 Гц

0–0,1 Гц

0,1–5 Гц

PREV

0,004/0

0,004/0

0,003/0

0,003/0

0,004/0

0,002/0

LR

0,003/0,339

0,003/0,245

0,002/0,421

0,003/0,350

0,003/0,191

0,001/0,551

LSTM

0,003/0,384

0,002/0,334

0,001/0,643

0,002/0,376

0,003/0,211

0,001/0,675

Примечание: составлена авторами на основе полученных данных в ходе исследования.

В спектре (рис. 4, а) наблюдается выраженная гребенчатая структура, соответствующая кратным гармоническим составляющим. Спектр (рис. 4, б) характеризуется преобладанием низкочастотных составляющих: амплитуда спектра убывает в диапазоне до 1,5 Гц, тогда как на более высоких частотах амплитуда остается на низком уровне. Основная энергия сигналов сосредоточена в диапазоне до 1 Гц.

В табл. 1 приводятся стандартные отклонения сигналов в различных частотных диапазонах.

В табл. 2 представлены результаты прогнозирования сигналов, выраженные через MAE и коэффициент корреляции Пирсона.

Метод PREV демонстрирует худшие результаты и не учитывает динамику сигнала. Наиболее высокие показатели качества прогноза наблюдаются в области НЧК, что подтверждается меньшим значением стандартного отклонения. LSTM демонстрирует лучшие значения корреляции Пирсона.

Заключение

Машинное обучение становится все более востребованным инструментом в условиях роста сложности современных электроэнергетических систем. В данной работе был проведен анализ влияния частоты энергосистем разных классов на возможность прогнозирования при помощи методов машинного обучения. Статистический анализ показал, что частота высоковольтной линии характеризуется большей стабильностью в сравнении с частотой внутренней сети. Дополнительно была выполнена апробация ряда методов прогнозирования временных рядов на короткий горизонт прогноза. Полученные метрики моделей согласуются с результатами предварительного анализа, что подтверждает его значимость. Наилучшие показатели прогнозирования наблюдаются в области низкочастотных колебаний. Показано, что методы машинного обучения способны эффективно выявлять закономерности во временных рядах и учитывать динамику сигнала, что позволяет использовать данные методы в качестве инструмента для мониторинга и поддержки принятия решений в управлении энергосистемой. Дальнейшее развитие исследования может быть направлено на повышение точности прогнозирования за счет расширения набора входных признаков и модификации архитектуры модели.