Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 1,172

GROUNDING OF FORECASTING FINANCIAL TIME SERIES BY AUTOREGRESSIVE – MOVING AVERAGE AND INTEGRATED AUTOREGRESSIVE – MOVING AVERAGE METHODS DEPENDING ON THE HURST EXPONENT

Zinenko A.V. 1
1 Siberian Federal University
The paper considers the application of statistical methods of autoregression – moving average and integrated autoregression – moving average to forecasting financial time series. These models differ in that in the integrated model, in order to ensure stationarity, not the actual levels of the series are taken, but the differences. Financial series can be both random and persistent – dependent on past values. The purpose of the work is to justify the use of autoregression – moving average and integrated autoregression – moving average models for forecasting financial time series, based on whether the current values ​​of the time series depend on the past ones, in other words, whether the time series are persistent. To implement forecasts, the paper uses the methods of autoregression – moving average and integrated autoregression – moving average, and to determine the persistence of the time series – the R / S analysis method. The results are tested on four indices of the largest stock exchanges, the forecast quality metric is the average absolute error in percent. For random time series, the autoregressive moving average model, which does not take differences, showed higher accuracy than the integrated autoregressive moving average model, which is appropriate for persistent time series.
financial markets
autoregressive moving average model
integrated autoregressive moving average model
R/S analysis
Hurst exponent

Введение

Прогнозирование экономических показателей зародилось в США в конце XIX – начале XX в. Как ученые, так и практикующие деятели финансового рынка исходили из концепции, согласно которой экономические показатели, такие, например, как показатели погоды, являются циклическими и, соответственно, могут быть точно предсказаны. В итоге данный подход оказался неверным, однако он привел к появлению множества институтов, занимающихся сбором данных и мониторингом по финансовым рынкам, а также к конструированию экономических показателей, которые используются и по сей день и список которых постоянно расширяется с развитием мировой экономики и финансовых рынков [1].

К статистическим методам прогнозирования одномерных временных рядов принадлежат авторегрессионные модели и модели сглаживания. Авторегрессионные модели представляют текущие значения временного ряда как регрессионную зависимость от прошлых значений, а модели сглаживания считают какой-либо скользящий показатель (например, простое среднее арифметическое) и на его основании продолжают тренд [2]. Также классические модели прогнозирования могут учитывать фактор сезонности. Подобного рода модели хорошо работают при прогнозировании временных рядов с ярко выраженным трендом.

Временные ряды с выраженным трендом и с сезонностью являются нестационарными временными рядами. К стационарным временным рядам относятся ряды с постоянным средним и дисперсией. На практике такими рядами описываются случайные процессы, которые прогнозировать еще проще, достаточно посчитать среднее значение и дисперсию, тогда все фактические значения будут где-то около среднего с разбросом в среднеквадратичное отклонение [3].

Если в классической инвестиционной теории финансовые временные ряды считались случайными и стационарными [4], то начиная с 1990-х гг. этот постулат был опровергнут [5], однако на практике использование традиционных моделей Марковитца и Шарпа [6] продолжалось.

Наиболее точными на данный момент статистическими методами прогнозирования временных рядов являются модели авторегрессии – скользящего среднего (ARMA) и интегрированной авторегрессии – скользящего среднего (ARIMA) [7, с. 102]. Первая модель применима к стационарным временным рядам, а вторая приводит временной ряд к стационарному виду путем взятия разниц. Стационарность временного ряда определяется тестом Дики – Фулера и для приведения финансового ряда к стационарному виду достаточно первого порядка разностей [8].

В данной работе рассматривается не тождественное, но близкое стационарности понятие, которое традиционно применяется к финансовым временным рядам – персистентность [9, с. 69]. Персистентность в большинстве источников определяется как зависимость от прошлых значений. Таким образом, персистентные временные ряды обладают некоторой трендовостью. Понятие персистентность было введено гидрологом Гарольдом Херстом применительно к природным явлениям, а затем перенесено на финансовую сферу учеными Бенуа Мандельбротом и Эдгаром Петерсом. Автор предлагает выбирать между моделями ARMA и ARIMA, исходя не из теста Дики – Фулера, определяющего стационарность временных рядов, а по итогам R/S анализа, который показывает, персистентен или случаен временной ряд.

Цель исследования состоит в обосновании использования моделей авторегрессии – скользящего среднего и интегрированной авторегрессии – скользящего среднего для прогнозирования финансовых котировок, исходя из зависимости текущих значений временных рядов от прошлых.

Материалы и методы исследования

Модели ARMA и ARIMA

Модель ARMA (p, q) представляется следующим уравнением

missing image file, (1)

где yt – текущий уровень ряда, yt–i – уровень ряда, отстающий на i периодов, εt – случайная компонента, εt–i – случайная компонента, отстающая на i периодов, αi, βi – параметры модели [10]. Первая сумма модели является компонентой авторегрессии, а вторая – компонентой скользящего среднего. В работах автора [11, 12] было предложено в качестве ошибки рассчитывать нормально распределенный шум с нулевым математическим ожиданием и стандартным отклонением, равным стандартному отклонению ошибки прогноза по модели авторегрессии, коэффициенты которой можно рассчитать по формулам, представленным в работах Бокса и Дженкинса. Для модели ARIMA формула (1) имеет вид

missing image file, (2)

где Δd – разность порядка d.

Порядок взятия разностей определяется тестом Дики–Фуллера [13, с. 227]. Параметры p и q определяются графиками частичной автокорреляции и автокорреляции. [13, с. 223]. Коэффициенты моделей ARMA и ARIMA рассчитываются в процессе обучения модели, путем минимизации стандартного отклонения прогнозных значений ряда от фактических.

R/S анализ

R/S анализ предназначен для нахождения показателя Херста (в данном случае с целью определить персистентность временного ряда). Алгоритм осуществления R/S анализа следующий [14]. Выбирается временной ряд достаточно большого размера. Дополнительным условием выступает большое количество собственных делителей, так как от этого зависит количество подвыборок и, соответственно, объем исходных данных для построения уравнения регрессии. Частное соседних уровней ряда логарифмируется и получается ряд log(yt / yi–1) длиной n.

Находится наименьший собственный делитель n, не меньший 10 (обозначение –m). Выборка делится на k = n / m групп. Элементы в каждой группе обозначены ti В каждой группе количество элементов составляет m. Средние значения в k-й группе

missing image file, missing image file, … , missing image file, (3)

накопленные отклонения от среднего Xi:

missing image file, missing image filemissing image file. (4)

По каждой группе нормированный размах Rk = max(Xi) – min(Xi). Стандартное отклонение Sk по каждой группе

missing image file. (5)

Показатель R / S по каждой группе рассчитывается как Rk / Sk. Средний размах вариации

missing image file (6)

Таким образом, получена выборка

missing image file, missing image file.

Строится уравнение линейной регрессии, в котором переменной X выступает логарифм показателя R / S, а переменной Y – логарифм количества элементов в j-й группе k:

missing image file (7)

где H, k – коэффициенты регрессии [15].

Автором разработан и запатентован алгоритм на Python, который позволяет рассчитать показатель Херста для различных финансовых инструментов и построить линию регрессии.

Результаты исследования и их обсуждение

Для анализа были взяты индексы AMEX, NASDAQ, NYSE американских фондовых бирж и индекс валютного рынка FOREX. Поскольку использовали данные за длительный период – 10 лет, данные по некоторым инструментам были пропущены и их пришлось отсечь. Также расчет показателя Херста потребовал более глубокой очистки данных. К примеру, для расчета показателя R/S требуется поместить стандартное отклонение в знаменатель. Таким образом, акции и валюты, котировки которых не меняются в течение длительных периодов и стандартное отклонение по ним соответственно равно нулю, отсекаются. В итоге по индексу AMEX был взят 131 инструмент, по NASDAQ – 162, по NYSE – 401, по FOREX – 338 инструментов. Из этих акций и валют выбирали те, у которых показатель Херста меньше либо равен 0,5, то есть случайные либо антиперсистентные акции.

Автором предложено выбирать модель ARMA для случайных и антиперсистентных временных рядов. Для того чтобы проверить, насколько это целесообразно, был осуществлен прогноз на годовых временных промежутках методами ARIMA и ARMA и сравнили их по метрике MAPE (средняя абсолютная ошибка в процентах). Общий период делился на тренировочный и прогнозный в соотношении 80:20. Таким образом были проанализированы котировки за 10 лет – с 2015 по 2024 г. Результаты показаны в таблице.

Из таблицы можно сделать вывод о том, что в большинстве случаев модель ARMA показывает меньшую среднюю ошибку. Только в 2018 г. по трем из двух индексов ARMA показала большую среднюю ошибку, при этом существенная разница была только по индексу AMEX. Отсюда следует вывод о том, что в первую очередь следует разделять акции по показателю Херста, а затем персистентные акции прогнозировать методом ARIMA со взятием разностей, а случайные и антиперсистентные – методом ARMA без взятия разностей. На рис. 1, 2 визуализированы прогнозы некоторых инструментов методами ARMA и ARIMA.

Усредненная по индексам MAPE (в %) по методам ARMA и ARIMA

Period

AMEX

NASDAQ

NYSE

FOREX

ARMA

ARIMA

ARMA

ARIMA

ARMA

ARIMA

ARMA

ARIMA

2015

9,7

20

6,4

6

6

7,3

44,6

20,4

2016

15,2

26,5

5,3

5,3

7,7

5,9

42,7

41,5

2017

9,8

17,3

6,2

5,7

6,3

6,3

42

17,5

2018

25

19

6,9

8,2

9

7,1

5,1

4,2

2019

8

16,1

5,5

5

5,8

5,4

6,1

20,6

2020

18,3

21,2

5,9

6,4

7,3

6

9

21

2021

10,8

16,7

10,5

6,7

9,8

6,7

2,4

3,1

2022

13

27,3

5,5

5,6

5,5

5,9

2,7

3,3

2023

15

28

6

7

5

5

2,8

3,2

2024

8,7

12,2

5,8

6,3

5,7

5

2,2

2,8

Источник: составлено автором на основе полученных данных в ходе исследования.

а) missing image file

б) missing image file

Рис. 1. Прогноз для акции Nivida методами а) ARMA, б) ARIMA Источник: составлено автором

а) missing image file

б) missing image file

Рис. 2. Прогноз для валютной пары Японская иена / Британский фунт методами а) ARMA, б) ARIMA Источник: составлено автором

Заключение

В работе рассматривалось прогнозирование финансовых инструментов методами ARMA и ARIMA. Также автором рассмотрен показатель Херста, который позволяет делать выводы о персистентном, случайном либо антиперсистентном характере временных рядов. Нами было выдвинуто предположение о том, что случайные и антиперсистентные ряды при прогнозировании методом ARIMA не нуждаются во взятии разниц и, таким образом, модель ARIMA вырождается в модель ARMA.

С помощью разработанного автором алгоритма на языке программирования Пайтон рассчитаны показатели Херста примерно по тысяче акций и валютных пар, входящих в американские фондовые индексы и инструменты рынка FOREX. Затем выбраны те из них, у которых показатель Херста меньше либо равен 0,5, и осуществлены прогнозы по годовым выборкам за 10 периодов с 2015 по 2024 г. методами ARMA и ARIMA. По каждому методу и по каждому периоду рассчитывалась метрика MAPE, усредненная по индексу. В большинстве случаев ошибка по методу ARMA была меньше (в части случаев существенно меньше), чем по методу ARIMA, из чего можно сделать вывод о том, что использовать метод ARMA вместо ARIMA для случайных и антиперсистентных по Херсту инструментов имеет смысл.