В настоящее время солнечная энергия является одним из важнейших возобновляемых источников энергии. Солнечную энергию можно легко получать с помощью фотоэлектрических панелей, как небольших установок на крышах домов, так и отдельных крупных фотоэлектрических станций (ФЭС). Благодаря повышению эффективности и доступности, в последние годы наблюдается быстрый рост количества установленных фотоэлектрических солнечных панелей по всему миру. Кроме того, благодаря своей экологической чистоте, во многих странах правительство поощряет использование солнечной энергии путем создания необходимых стимулирующих мер и поддержки. По всем этим причинам солнечная энергия, как ожидается, внесёт значительный вклад в глобальное энергоснабжение в ближайшем будущем. Согласно данным исследований, в ближайшие четыре года мощность установленных фотоэлектрических энергосистем по всему миру увеличится втрое и достигнет 540 ГВт, а к 2050 г. около 30 % электроэнергии в мире будет поставляться из фотоэлектрических систем [1].
Несмотря на то, что солнечная энергия имеет много преимуществ по сравнению с другими традиционными источниками энергии, такими как уголь и природный газ, вырабатываемая мощность фотоэлектрических батарей сильно варьируется, так как она зависит не только от солнечного излучения, температуры, но и от других метеорологических факторов, таких как скорость ветра, солнечные часы, влажность, облачный покров, осадки и т.д. Солнечная энергия также является прерывистым источником энергии, так как она доступна только в дневное время [2, 3]. Такая изменчивость и прерывистость солнечной энергии делает ее крупномасштабную интеграцию в энергосистему сложной задачей. В солнечной энергии часто происходят неожиданные изменения, негативно влияя на баланс сети и увеличивая эксплуатационные расходы. В связи с непостоянным и неуправляемым характером точный прогноз вырабатываемой солнечной электроэнергии имеет существенное значение для сетевого оператора и компаний, поставляющих электрическую энергию из фотоэлектрической системы. Чтобы получить максимальную экономическую выгоду от фотоэлектрической системы, необходимо разработать алгоритм для поддержания стабильности энергоснабжающей системы. Такая стабильность может быть достигнута путем создания методов прогнозирования вырабатываемой мощности и обеспечения приблизительного производства в будущем. Это позволяет энергоснабжающим компаниям создавать управляющий механизм для переключения между имеющимися доступными источниками энергии, присутствующими в данной комбинированной станции.
Целью данной работы является исследование производительности существующих современных методов машинного обучения для прогнозирования вырабатываемой солнечной мощности с улучшенными показателями. В ближайшее время планируется применять эти методы для фотоэлектрических установок, в основном находящихся в Сибири и на Дальнем Востоке.
Материалы и методы исследования
Методы, используемые для прогнозирования солнечной электроэнергии, разделяются по четырем категориям [4]:
- Метеорологические методы – косвенные методы, основанные на численном прогнозе погоды и на обработке спутниковых снимков, что позволяет сначала прогнозировать интенсивность солнечной радиации, а затем преобразовать в выходную мощность фотоэлектрической системы.
- Статистические методы – эти методы используют статистические подходы, такие как модель авторегрессии скользящего среднего (ARMA), интегрированная модель авторегрессии скользящего среднего (ARIMA), а также экспоненциальное сглаживание (ES). Эти модели могут быть использованы для прямого прогнозирования выходной мощности фотоэлектрических батарей, без необходимости первичного прогноза солнечного излучения.
- Методы машинного обучения – эти методы используют алгоритмы машинного обучения, такие как метод k-ближайших соседей, нейронные сети (NN), метод опорных векторов (SVR) и прогнозирование на основе последовательности моделей (PSF), для прямого прогнозирования выходной мощности фотоэлектрических батарей. Как правило, существует два подхода к применению методов машинного обучения: построение одной модели прогнозирования или объединение нескольких моделей прогнозирования вместе для формирования ансамбля моделей прогнозирования [5].
- Гибридные методы – эти методы объединяют модели или различные компоненты из предыдущих трех категорий. Немного отличающиеся от ансамблей, которые объединяют модели машинного обучения, гибридные модели обычно объединяют метеорологические модели с машинным обучением и статистическими моделями или компонентами вместе.
Использование методов машинного обучения, таких как NN и SVR, и статистических методов, таких как ARIMA и ES, является популярным для построения моделей для прогнозирования мощности солнечной электростанции. Однако большинство из этих методов основано на одной общей модели прогнозирования для всех метеорологических условий и соответствующих им ежедневных фотоэлектрических характеристик. Предлагаемый нами подход к прогнозированию мощности солнечной электростанции включает кластеризацию с применением методов машинного обучения для прогнозирования. Основная идея заключается в группировке дней по их метеорологическим характеристикам и построении отдельной модели для каждого из кластеров. На рис. 1 показана общая структура выбранного нами метода. Существует три основных этапа: кластеризация, обучение моделей прогнозирования и формирование прогнозов на последующие дни.
Рис. 1. Основные этапы предлагаемых методов прогнозирования на базе кластеризации
Алгоритм k-средних, используемый в данной работе для решения задачи кластеризации, принимает в качестве входных данных набор данных X, содержащий N точек, и количество кластеров K. На выходе получаем K центроидов кластеров и точки множества X, относящие к определенному кластеру [6, 7]. Все точки одного кластера расположены ближе к своему центроиду, чем к любому другому из центроидов. Математическое выражение для K кластеров Ck и K центроидов μk имеет вид
Минимум (1)
Результаты исследования и их обсуждение
Для оценки эффективности предлагаемого метода, было проведено исследование конкретного примера с использованием пятилетних данных (с 1 января 2011 г. по 31 декабря 2015 г.) ФЭС, находящейся в г. Томске, Россия. Для каждого дня были выбраны данные только в течение светового дня, с 5 утра до 19 вечера. Оригинальные фотоэлектрические данные собираются с интервалом в 10 мин и содержат 5х365х90 = 164250 измерений. Каждое отсутствующее значение заменяется средним значением из предыдущих 60 мин. Были суммированы данные в 30-минутные интервалы, так как наша задача – сделать получасовой прогноз на следующий день. Таким образом, мы имеем 30 значений за один день и 30х365х5 = 54750 значений за два года. Данные тогда нормируются к интервалу [0–1].
По завершении процесса прогнозирования, полученный результат сравнивается с фактическим значением и некоторыми другими методами, не основанными на кластеризации, в том числе NN, SVR, ARIMA. Пример сравнения результатов прогнозирования показан на рис. 2, а, и 2, б.
На рис. 2, а, и 2, б, приведены фактические графики суточной выработки электроэнергии в сравнении с графиками прогнозирования в моделях прогнозирования. По рисункам видно, что прогнозы хорошо совпадают с фактическими данными, особенно в зимний период, когда система не генерировала много энергии. А в летний период предлагаемая нами модель имеет существенное преимущество перед другими моделями. Пример прогнозных значений в сравнении с фактическими значениями в июне показан на рис. 3.
а)
б)
Рис. 2. Пример результатов прогнозирования по разным методам а) на летнее время; б) на зимнее время
Рис. 3. Пример результатов прогнозирования в июне в сравнении с фактическими значениями
Для оценки точности прогнозных моделей используют два коэффициента: среднюю абсолютную ошибку (англ. Mean Absolute Error, MAE) и среднюю абсолютную процентную ошибку (англ. Mean Absolute Percentage Error, MAPE). Они представлены в формулах (2) и (3) соответственно:
(2)
(3)
где yt – фактическое значение, а – про- гнозное.
Средняя абсолютная ошибка MAE представляет собой среднее значение абсолютных погрешностей между прогнозируемыми и фактическими значениями, которое отражает фактическую прогнозируемую погрешность значений. А средняя абсолютная процентная ошибка MAPE показывает соотношение между погрешностью и фактическим значением. Чем меньше значения MAE, MAPE, тем точнее результат прогнозирования. Абсолютная процентная ошибка по дням июня представлена на рис. 4. А средняя абсолютная процентная ошибка в этом месяце составляет 6,92 %.
Рис. 4. Абсолютная процентная ошибка по дням июня
Заключение
В данной статье рассмотрен метод прогнозирования вырабатываемой мощности фотоэлектрических станций, основанный на алгоритме кластеризации k-средних. Результат анализа показан, что при построении отдельных моделей для каждой категорий дней точность прогнозирования значительно повышается. Разработанная модель дает возможность повышения эффективности эксплуатации фотоэлектрических станций. В будущем планируется совершенствовать методы прогнозирования и применять их в реальных условиях в Сибири и на Дальнем Востоке.