В последние десятилетия по всему миру наблюдается резкое увеличение числа погодных явлений, оказывающих неблагоприятное воздействие на население, объекты сельского хозяйства, средства коммуникации, объекты ЖКХ и т.д. Лесные пожары, наводнения, ураганы, землетрясения, цунами наносят колоссальный ущерб экономике и уносят человеческие жизни. Часто опасные погодные явления вызваны глобальными природными процессами (изменением климата), ухудшением экологической обстановки, деятельностью человека и т.д. Снизить ущерб от опасных погодных явлений возможно при своевременном оповещении населения, коммунальных служб, работников сельскохозяйственных предприятий, служб МЧС и т.д. Это становится возможным при выполнении прогнозирования подобных явлений.
Прогнозирование погодных явлений чаще всего сводится к предсказанию температуры воздуха, скорости ветра, возможности осадков и т.д. Из опасных явлений выделяются грозы, сильные порывы ветра, резкие снижения температуры, гололедица и т.д.
В настоящее время прогнозы строятся на основе глобального моделирования атмосферы (Weather Research and Forecasting). Такие прогнозы дают неплохие результаты в местах с хорошо организованными наблюдениями за погодой (Европа, США). Такие прогнозы строятся для больших территорий, используют десятки гигабайт исходных данных и выполняются на мощных вычислительных кластерах. Возникает задача прогнозирования тех или иных опасных погодных явлений, способных развиваться на конкретных территориях, с использованием небольшого количества исходных данных и незначительных вычислительных ресурсов.
В последние годы в мире активно ведутся работы по использованию методов машинного обучения для составления погодных прогнозов [1]. Большую популярность приобретает использование нейронных сетей. Прогнозирование погоды на основе нейронных сетей претерпело значительные изменения за последние три десятилетия. До 2000 г. статистика выходных данных моделей (MOS) широко использовалась для улучшения способности численных моделей выполнять прогнозы путем соотнесения выходных данных моделей и данными наблюдений. В работе [2] предложена система прогнозирования минимальной температуры на основе искусственной нейронной сети с использованием алгоритмов обратного распространения ошибки. Эта концепция значительно снизила вычислительные требования MOS и повысила эффективность прогнозов. В работе [3] предложена модель прогнозирования снегопадов и дождевых осадков на основе изображений метеорологического радиолокатора с искусственной нейронной сетью. Результаты показывают, что искусственная нейронная сеть более эффективна, чем традиционный метод взаимной корреляции, а метод постоянного прогнозирования дает существенное снижение ошибки прогнозирования. В [4] проведен сравнительный анализ различных моделей нейронных сетей для прогнозирования суточной максимальной и минимальной температуры и скорости ветра. Результаты показали, что сеть радиальных базисных функций (RBFN) дает наиболее точный прогноз по сравнению с рекуррентной нейронной сетью Элмана (ELNN) и сетями многослойных персептронов (MLP). В [5] введен примерный набор нечеткой нейронной сети для прогнозирования погодных параметров: точки росы, скорость ветра, температуры и видимости. Модель включала ряд нечетких правил, и их начальные веса были оценены с помощью более глубокой сети для прогнозирования погоды.
В [6] для прогнозирования температуры была реализована нейронная сеть с обратным распространением (BPN). Эта сеть успешно выявила нелинейную структурную взаимосвязь между различными входными погодными параметрами. В [7] предложена гибридная модель для прогнозирования температуры, основанная на ансамбле нейронных сетей (ENN). В [8] для краткосрочного прогнозирования скорости ветра были применены восемь различных древовидных структур регрессии. Автор также сравнил лучший подход дерева регрессии с другими подходами искусственного интеллекта (поддерживающая векторная регрессия, MLP, машины с экстремальным обучением, полилинейная регрессия). Лучшее дерево регрессии дает наилучшие результаты для предсказания скорости ветра. В [9] применяется глубокое обучение со слоями LSTM для прогнозирования текущей погоды. Результаты экспериментов показывают, что сеть LSTM способна фиксировать пространственно-временные корреляции и может использоваться для прогнозирования текущей погоды. В [10] разработана модель для прогнозирования умеренного климата в Неваде с использованием глубокой нейронной сети со сложенными шумоподавляющими автокодировщиками с более высокой точностью (97,97 %) по сравнению с традиционными нейронными сетями (94,92 %). В [11] был использован подход LSTM с многоуровневым глубоким обучением для прогнозирования погодных параметров, температуры, влажности и скорости ветра.
В [12] разработана модель краткосрочного локального прогнозирования дождя и температуры с использованием глубокой нейронной сети. Автор пришел к выводу, что глубокие нейронные сети обеспечивают самую высокую точность предсказания дождя среди нескольких методов машинного обучения.
Таким образом, прогнозирование погодных явлений на основе компьютерного моделирования и нейронных сетей является актуальной и перспективной задачей. Существующие модели для достижения высокой точности прогнозов используют в качестве исходных данных достаточно большие наборы параметров (достигающие нескольких тысяч). Кроме того, подходы преимущественно направлены на предсказание основных климатических параметров, а не на предсказания наступления тех или иных событий (в нашем случае таких опасных погодных явлений, как гололедица, грозы, сильные порывы ветра, резкие снижения температуры и т.д.). Интерес представляет также сведение к минимуму числа параметров, используемых для предсказания.
Работа посвящена вопросам прогнозирования опасных погодных явлений для конкретных территорий. Компьютерное прогнозирование погоды получило в настоящее время широкое распространение. Оно основывается на анализе и обработке данных погодных наблюдений предшествующих периодов, выявлении закономерностей их изменения и получении (прогнозировании) значений климатических параметров для последующих периодов. Для прогнозирования погоды активно используются методы линейной регрессии и нейронные сети, хорошо зарекомендовавшие себя в широком круге задач и позволяющие добиться высоких результатов точности прогнозирования.
Цель работы – рассмотреть вопросы применения многослойных нейронных сетей для прогнозирования опасных погодных явлений и осуществить выбор наименьшего числа параметров, используемых для прогнозирования.
Материалы и методы исследования
Многослойная нейронная сеть представляет собой нейронную сеть, состоящую из входного, выходного и расположенных между ними скрытых слоев нейронов. Каждый нейрон предыдущего слоя связан со всеми нейронами последующего слоя. Связи между нейронами внутри слоев отсутствуют. Нейроны первого слоя (входной слой) принимают исходные данные и распределяют их по нейронам последующего слоя. Обработка данных на первом слое не выполняется. Последний слой нейронной сети называется выходным слоем. На выходах нейронов этого слоя формируются предсказанные значения. Между входным и выходным слоями находятся скрытые слои (один или несколько). Входы и выходы таких слоев неизвестны извне нейронной сети. Многослойные нейронные сети позволяют моделировать функции практически любой степени сложности. Число слоев и число нейронов определяют сложность функции.
В настоящее время во всем мире идет накопление данных о погодных условиях. Активно используется сбор данных с метеостанций, радиозондов и т.д. в реальном времени. Известность получили такие архивы погодных наблюдений, как Weather Underground (https://www.wunderground.com/), Расписание погоды (https://rp5.ru/), National Climatic Data Center (http://www.ncdc.noaa.gov/) и т.д. В таких архивах для каждого дня наблюдений хранятся данные о различных метеорологических параметрах: температуре в определенные часы, наибольшей и наименьшей температуре, температуре точки росы, наибольшей и наименьшей влажности, давлении, скорости и направлении ветра, грозовой активности и т.д. Наличие таких ретроспективных данных открывает возможность проведения их анализа и выявления предпосылок для возникновения тех или иных опасных погодных явлений.
Любые события, в том числе опасные погодные явления, вызваны какими-то предыдущими событиями-предпосылками. Например, предвестниками гроз являются бурное и быстрое развитие темных кучево-дождевых облаков, резкое снижение температуры воздуха, безветрие и затишье в природе, появление на небе пелены и т.д. Проведение корреляционного анализа изменений тех или иных метеорологических параметров и их сочетаний непосредственно перед наступлением опасных погодных явлений дает возможность выявить устойчивые предпосылки. Таким образом, можно попробовать предсказывать опасные погодные условия, базируясь не на глобальных климатических моделях, требующих больших вычислительных мощностей и обработки огромных объемов данных, а на рассмотрении текущих метеорологических условий и анализе данных за прошлые периоды.
В качестве источника данных наблюдений использовались данные с метеостанции № 27553 аэропорта им. В.П. Чкалова (Стригино, Нижний Новгород) [13]. Данные собираются метеостанцией в автоматическом режиме каждые 3 часа и доступны в режиме онлайн. Метеостанция на момент проведения исследований предоставляла следующие метеопараметры: температура воздуха на высоте 2 м над поверхностью земли, минимальная температура воздуха за прошедший период (не более 12 ч), максимальная температура воздуха за прошедший период (не более 12 ч), температура воды поверхности в срок наблюдения, атмосферное давление, приведенное к среднему уровню моря, атмосферное давление на уровне станции, барическая тенденция: изменение атмосферного давления за последние 3 часа, общее количество облаков всех ярусов (проценты), количество выпавших осадков, скорость ветра на высоте 10–12 м над земной поверхностью, осредненная за 10-минутный период, непосредственно предшествовавший сроку наблюдения, максимальное значение порыва ветра на высоте 10–12 м над земной поверхностью за период между сроками, максимальное значение порыва ветра на высоте 10–12 м над земной поверхностью за 10-минутный период, непосредственно предшествующий сроку наблюдения, горизонтальная дальность видимости, высота снежного покрова, высота основания самых низких облаков, точка росы, относительная влажность воздуха. На основании данных наблюдений за погодой в Нижнем Новгороде был подготовлен тестовый набор данных. В него вошли вышеописанные данные о климатических параметрах в рассматриваемый день и данные о климатических параметрах за последние 3 дня (с шагом 3 ч). Общее число параметров составило 408. Таким образом, область рассматриваемых данных ограничивалась данными наблюдений в одной точке (одной метеостанции) в течение трех дней, не затрагивая данные более ранних наблюдений и сведения с близлежащих территорий.
Результаты исследования и их обсуждение
Для предсказания опасных погодных явлений можно использовать как одну нейронную сеть с множеством выходов (каждый выход представляет отдельное погодное явление), так и набор нейронных сетей с одним выходом (каждая нейронная сеть отвечает за отдельное погодное явление). Эксперименты показали, что каждое погодное явление коррелировано только с небольшим набором метеорологических параметров. Использование единой нейронной сети неизбежно вызывает увеличение числа входов в нейронной сети, а как следствие – усложнение сети и повышение вычислительной нагрузки. Напротив, использование для каждого явления отдельной сети позволяет использовать определенный набор небольшого количества входных параметров. Это упрощает структуру каждой конкретной нейронной сети, снижает вычислительные затраты. Кроме того, использование отдельных нейронных сетей позволяет целенаправленно применять их в конкретных условиях (например, в сельском хозяйстве для предсказания заморозков, в МЧС – гроз, ураганов, наводнений и т.д.). По этой причине был выбран второй вариант – с использованием набора отдельных нейронных сетей. Таким образом, были реализованы нейронные сети для предсказания гроз, заморозков, гололедицы. Такие сети хорошо справляются с предсказаниями на основе анализа данных от нескольких часов до нескольких дней.
При подборе структуры нейронных сетей была поставлена задача использования минимального числа анализируемых параметров с обеспечением приемлемой точности предсказаний (для большинства задач – более 90 %). Нейронные сети были реализованы с использованием пакета Keras TensorFlow, реализованного для Python. В качестве оптимизационного алгоритма использовался Adam (adaptive moment estimation). Он сочетает в себе и идею накопления движения, и идею более слабого обновления весов для типичных признаков. В качестве функции активации на каждом слое использовалась ReLU (rectified linear unit). Для каждой нейронной сети был осуществлен выбор параметров, числа скрытых слоев и количества нейронов на каждом слое. Выбор параметров проводился на основе корреляционного анализа [14]. В ходе экспериментов удалось сократить число параметров для предсказания заморозков до 6, гололедицы – до 10, гроз – до 60. При этом точность предсказаний составила более 90 % (рисунок).
Для предсказания заморозков были выбраны параметры: температура в 12 ч, температура в 21 ч, точка росы в 12 ч, точка росы в 21 ч, облачность и относительная влажность. Для предсказания гололедицы были выбраны параметры: точка росы в 12 ч, точка росы в 21 ч, температура за последние 8 периодов наблюдений.
Зависимость точности предсказаний от количества признаков
Для предсказания гроз были выбраны параметры за последние 6 периодов наблюдений (с шагом 3 ч): температура воздуха, атмосферное давление, барическая тенденция, общее количество облаков, скорость ветра на высоте 10–12 м над земной поверхностью, максимальное значение порыва ветра на высоте 10–12 м над земной поверхностью за период между сроками, максимальное значение порыва ветра на высоте 10–12 м над земной поверхностью за 10-минутный период, высота основания самых низких облаков, точка росы, относительная влажность воздуха. Рассмотрим для примера нейронную сеть для предсказания гроз. Была предложена следующая структура многослойной нейронной сети: входной слой, состоящий из 60 нейронов, первый скрытый слой, состоящий их 30 нейронов, второй скрытый слой, состоящий их 15 нейронов, выходной слой, состоящий из одного нейрона. Нейронная сеть для предсказания гроз включает: входной слой, состоящий из 10 нейронов, скрытый слой, состоящий их 10 нейронов, второй скрытый слой, состоящий их 5 нейронов, выходной слой, состоящий из одного нейрона. Кроме того, была реализована нейронная сеть для предсказания вероятности лесных пожаров. Эта сеть отличается необходимостью анализа данных за длительные периоды времени (месяц и более) и нечеткими условиями наступления события. Если грозы и заморозки сами по себе являются событиями, то лесные пожары можно оценить только с определенной вероятностью, которая чаще всего не реализуется в виде фактических пожаров. Точность прогнозов при этом составила около 60 %.
Заключение
Использование многослойной нейронной сети для прогнозирования опасных погодных явлений дает вполне приемлемые результаты. Средняя точность прогнозов составляет более 90 %. Построенные нейронные сети используют небольшой набор входных данных и требуют незначительных вычислительных ресурсов. Это позволяет использовать их на переносных устройствах для автономного предупреждения и реагирования на возможное появление опасных погодных явлений. Так, модули управления теплицами могут реагировать на возможности заморозков закрытием створок или включением подогрева, автомобили – на вероятность гололедицы и т.д.
Полученные результаты могут быть использованы и для других населенных пунктов, так как построенные нейронные сети учитывают динамику климатических параметров, носящую обобщенный характер для регионов Центральной России. Выборочные проверки предсказания опасных погодных условий для г. Владимира и г. Мурома продемонстрировали точность прогнозов, сравнимую с тестовыми данными.
Библиографическая ссылка
Шарапов Р.В. ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРЕДСКАЗАНИЯ ОПАСНЫХ ПОГОДНЫХ ЯВЛЕНИЙ // Современные наукоемкие технологии. – 2023. – № 1. – С. 78-82;URL: https://top-technologies.ru/ru/article/view?id=39500 (дата обращения: 10.12.2024).