Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

POWER FORECASTING OF PHOTOVOLTAIC SYSTEMS BASED ON MACHINE LEARNING USING METEOROLOGICAL PARAMETERS IN SIBERIA AND THE RUSSIAN FAR EAST

Din V.T. 1 Yurchenko A.V. 1, 2 Dang T.F.T. 2 Nguyen D.K. 3
1 National Research Tomsk Polytechnic University
2 National Research Tomsk State University
3 Military Industrial College
Solar energy is one of the most promising environmental-friendly power sources. Its proportion in the global energy market is increasing significantly thanks to photovoltaic (PV) technology developments, which have made it possible to produce more efficient photovoltaic solar panels and substantially reduce their cost. However, solar panel power generation is affected by various meteorological factors such as solar radiation, cloud cover, precipitation, and temperature. This variability has an unfavorable effect on the large-scale integration of solar energy into energy supply systems. Therefore, the successful integration of solar energy into the electric grid requires accurate prediction of the power generated by photovoltaic panels. The task of predicting photovoltaic power for the coming days in 30-minute intervals was considered. Such prediction is sufficiently valuable for analyzing the condition of solar PV plants and for making related decisions. This paper uses various data sources, including historical photovoltaic power output data, historical meteorological parameter data, and weather forecasts. Numerous existing algorithms build a single prediction model for all variants of meteorological parameters. We, in contrast, apply clustering to divide days into groups with similar meteorological characteristics and then create a separate photovoltaic power prediction model for each group. The results show promising potential for real-world applications, especially for photovoltaic systems based in Siberia and the Far East.
photovoltaic systems
power forecasting
machine learning
neural networks
meteorological parameters

В настоящее время солнечная энергия является одним из важнейших возобновляемых источников энергии. Солнечную энергию можно легко получать с помощью фотоэлектрических панелей, как небольших установок на крышах домов, так и отдельных крупных фотоэлектрических станций (ФЭС). Благодаря повышению эффективности и доступности, в последние годы наблюдается быстрый рост количества установленных фотоэлектрических солнечных панелей по всему миру. Кроме того, благодаря своей экологической чистоте, во многих странах правительство поощряет использование солнечной энергии путем создания необходимых стимулирующих мер и поддержки. По всем этим причинам солнечная энергия, как ожидается, внесёт значительный вклад в глобальное энергоснабжение в ближайшем будущем. Согласно данным исследований, в ближайшие четыре года мощность установленных фотоэлектрических энергосистем по всему миру увеличится втрое и достигнет 540 ГВт, а к 2050 г. около 30 % электроэнергии в мире будет поставляться из фотоэлектрических систем [1].

Несмотря на то, что солнечная энергия имеет много преимуществ по сравнению с другими традиционными источниками энергии, такими как уголь и природный газ, вырабатываемая мощность фотоэлектрических батарей сильно варьируется, так как она зависит не только от солнечного излучения, температуры, но и от других метеорологических факторов, таких как скорость ветра, солнечные часы, влажность, облачный покров, осадки и т.д. Солнечная энергия также является прерывистым источником энергии, так как она доступна только в дневное время [2, 3]. Такая изменчивость и прерывистость солнечной энергии делает ее крупномасштабную интеграцию в энергосистему сложной задачей. В солнечной энергии часто происходят неожиданные изменения, негативно влияя на баланс сети и увеличивая эксплуатационные расходы. В связи с непостоянным и неуправляемым характером точный прогноз вырабатываемой солнечной электроэнергии имеет существенное значение для сетевого оператора и компаний, поставляющих электрическую энергию из фотоэлектрической системы. Чтобы получить максимальную экономическую выгоду от фотоэлектрической системы, необходимо разработать алгоритм для поддержания стабильности энергоснабжающей системы. Такая стабильность может быть достигнута путем создания методов прогнозирования вырабатываемой мощности и обеспечения приблизительного производства в будущем. Это позволяет энергоснабжающим компаниям создавать управляющий механизм для переключения между имеющимися доступными источниками энергии, присутствующими в данной комбинированной станции.

Целью данной работы является исследование производительности существующих современных методов машинного обучения для прогнозирования вырабатываемой солнечной мощности с улучшенными показателями. В ближайшее время планируется применять эти методы для фотоэлектрических установок, в основном находящихся в Сибири и на Дальнем Востоке.

Материалы и методы исследования

Методы, используемые для прогнозирования солнечной электроэнергии, разделяются по четырем категориям [4]:

- Метеорологические методы – косвенные методы, основанные на численном прогнозе погоды и на обработке спутниковых снимков, что позволяет сначала прогнозировать интенсивность солнечной радиации, а затем преобразовать в выходную мощность фотоэлектрической системы.

- Статистические методы – эти методы используют статистические подходы, такие как модель авторегрессии скользящего среднего (ARMA), интегрированная модель авторегрессии скользящего среднего (ARIMA), а также экспоненциальное сглаживание (ES). Эти модели могут быть использованы для прямого прогнозирования выходной мощности фотоэлектрических батарей, без необходимости первичного прогноза солнечного излучения.

- Методы машинного обучения – эти методы используют алгоритмы машинного обучения, такие как метод k-ближайших соседей, нейронные сети (NN), метод опорных векторов (SVR) и прогнозирование на основе последовательности моделей (PSF), для прямого прогнозирования выходной мощности фотоэлектрических батарей. Как правило, существует два подхода к применению методов машинного обучения: построение одной модели прогнозирования или объединение нескольких моделей прогнозирования вместе для формирования ансамбля моделей прогнозирования [5].

- Гибридные методы – эти методы объединяют модели или различные компоненты из предыдущих трех категорий. Немного отличающиеся от ансамблей, которые объединяют модели машинного обучения, гибридные модели обычно объединяют метеорологические модели с машинным обучением и статистическими моделями или компонентами вместе.

Использование методов машинного обучения, таких как NN и SVR, и статистических методов, таких как ARIMA и ES, является популярным для построения моделей для прогнозирования мощности солнечной электростанции. Однако большинство из этих методов основано на одной общей модели прогнозирования для всех метеорологических условий и соответствующих им ежедневных фотоэлектрических характеристик. Предлагаемый нами подход к прогнозированию мощности солнечной электростанции включает кластеризацию с применением методов машинного обучения для прогнозирования. Основная идея заключается в группировке дней по их метеорологическим характеристикам и построении отдельной модели для каждого из кластеров. На рис. 1 показана общая структура выбранного нами метода. Существует три основных этапа: кластеризация, обучение моделей прогнозирования и формирование прогнозов на последующие дни.

missing image file

Рис. 1. Основные этапы предлагаемых методов прогнозирования на базе кластеризации

Алгоритм k-средних, используемый в данной работе для решения задачи кластеризации, принимает в качестве входных данных набор данных X, содержащий N точек, и количество кластеров K. На выходе получаем K центроидов кластеров и точки множества X, относящие к определенному кластеру [6, 7]. Все точки одного кластера расположены ближе к своему центроиду, чем к любому другому из центроидов. Математическое выражение для K кластеров Ck и K центроидов μk имеет вид

Минимум missing image file (1)

Результаты исследования и их обсуждение

Для оценки эффективности предлагаемого метода, было проведено исследование конкретного примера с использованием пятилетних данных (с 1 января 2011 г. по 31 декабря 2015 г.) ФЭС, находящейся в г. Томске, Россия. Для каждого дня были выбраны данные только в течение светового дня, с 5 утра до 19 вечера. Оригинальные фотоэлектрические данные собираются с интервалом в 10 мин и содержат 5х365х90 = 164250 измерений. Каждое отсутствующее значение заменяется средним значением из предыдущих 60 мин. Были суммированы данные в 30-минутные интервалы, так как наша задача – сделать получасовой прогноз на следующий день. Таким образом, мы имеем 30 значений за один день и 30х365х5 = 54750 значений за два года. Данные тогда нормируются к интервалу [0–1].

По завершении процесса прогнозирования, полученный результат сравнивается с фактическим значением и некоторыми другими методами, не основанными на кластеризации, в том числе NN, SVR, ARIMA. Пример сравнения результатов прогнозирования показан на рис. 2, а, и 2, б.

На рис. 2, а, и 2, б, приведены фактические графики суточной выработки электроэнергии в сравнении с графиками прогнозирования в моделях прогнозирования. По рисункам видно, что прогнозы хорошо совпадают с фактическими данными, особенно в зимний период, когда система не генерировала много энергии. А в летний период предлагаемая нами модель имеет существенное преимущество перед другими моделями. Пример прогнозных значений в сравнении с фактическими значениями в июне показан на рис. 3.

missing image file

а)

missing image file

б)

Рис. 2. Пример результатов прогнозирования по разным методам а) на летнее время; б) на зимнее время

missing image file

Рис. 3. Пример результатов прогнозирования в июне в сравнении с фактическими значениями

Для оценки точности прогнозных моделей используют два коэффициента: среднюю абсолютную ошибку (англ. Mean Absolute Error, MAE) и среднюю абсолютную процентную ошибку (англ. Mean Absolute Percentage Error, MAPE). Они представлены в формулах (2) и (3) соответственно:

missing image file (2)

missing image file (3)

где yt – фактическое значение, а missing image file – про- гнозное.

Средняя абсолютная ошибка MAE представляет собой среднее значение абсолютных погрешностей между прогнозируемыми и фактическими значениями, которое отражает фактическую прогнозируемую погрешность значений. А средняя абсолютная процентная ошибка MAPE показывает соотношение между погрешностью и фактическим значением. Чем меньше значения MAE, MAPE, тем точнее результат прогнозирования. Абсолютная процентная ошибка по дням июня представлена на рис. 4. А средняя абсолютная процентная ошибка в этом месяце составляет 6,92 %.

missing image file

Рис. 4. Абсолютная процентная ошибка по дням июня

Заключение

В данной статье рассмотрен метод прогнозирования вырабатываемой мощности фотоэлектрических станций, основанный на алгоритме кластеризации k-средних. Результат анализа показан, что при построении отдельных моделей для каждой категорий дней точность прогнозирования значительно повышается. Разработанная модель дает возможность повышения эффективности эксплуатации фотоэлектрических станций. В будущем планируется совершенствовать методы прогнозирования и применять их в реальных условиях в Сибири и на Дальнем Востоке.