Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,940

TO ESTIMATION OF THE TREND REVERSAL FORECAST BASED ON STABLE ADDRESS SORTING

Romm Ya.E. 1 Dzhanunts G.A. 1 Turilin A.S. 1
1 A.P. Chekhov Taganrog Institute (branch) of Rostov State University of Economics
The purpose of the work is to estimate the trend reversal forecast of the stock exchange trading digitized data, depending on the parameters of heuristic values of the proposed method. The method is based on an algorithm for identifying extreme elements of a sequence using stable address sorting, which has a one-to-one correspondence of the input and output indexes of the sorted elements. In any numerical sequence, such sorting allows you to select all locally extreme elements for an arbitrary localization radius. A trend reversal is indicated by a sequence of informative extrema, their identification is performed iteratively. The parameters of the method are the initial values of the extremum radii of localization, the number of iterations, and the length of the processed sequence. The influence of parameter values on the reliability of the forecast is estimated. For this purpose, statistics on the reliability of forecasts have been collected using historical data as an example. Arrays of 43,200 numbers in float format (closing price values for the last 30 days at one-minute interval) at various time intervals between 2001-11-28 00:00:00 and 2017-03-06 00:00:00 are considered as input sequences. According to estimates, the reliability of the forecast is practically not affected by the heuristic initial values of the extrema radii of localization. Similarly, it does not affect fixing the number of iterations from a small range to achieve a repeating finite set of informative local extrema. An increase in the length of the processed sequence, starting from a certain value, also has no effect on the reliability of the forecast. According to the experiment, the reliability of the trend reversal forecast by the proposed method is estimated at about 70 %.
stock exchange trading
sorting
identification of informative extremes
determination of trends and their reversals
assessment of forecast reliability

Введение

Обработка данных биржевых валютных торгов выполняется с помощью алгоритма идентификации экстремальных элементов последовательности на основе устойчивой адресной сортировки, алгоритм детально описан в [1, с. 53–59]. Сортировка при этом должна обладать взаимно однозначным соответствием входных и выходных индексов сортируемых элементов. Существо метода состоит в следующем. В любой числовой последовательности из N элементов используемая сортировка позволяет выделить все локально минимальные элементы для произвольно заданного радиуса локализации согласно условию

missing image file,

где каждый локально минимальный элемент с входным индексом ek, 1 ≤ k ≤ N, в произвольном радиусе локализации r = ε0 идентифицируется непосредственно по построению, если индексы ek располагаются в порядке отсортированных элементов. Аналогично локально максимальные элементы идентифицируются по условию

missing image file.

С помощью этих условий, с использованием итераций, выделяются именно те существенные (информативные) экстремумы, которые определяют разворот тренда. Если последний слева направо из определяющих экстремумов является максимумом вблизи конца последовательности, то ее продолжение соответствует развороту тренда к спаду. Если последний из таких экстремумов является минимумом вблизи конца последовательности, то ее продолжение соответствует развороту тренда к подъему. Если такой экстремум идентифицирован непосредственно на правой границе последовательности, то это может быть признаком продолжения тренда. В рамках данного подхода необходимо знать, как влияют на достоверность прогноза значения параметров метода. В частности, ставится вопрос, как влияют на достоверность априори задаваемые начальные значения радиусов локализации экстремумов. Аналогичный вопрос ставится по отношению к параметрическому количеству итерационно повторяющихся локальных экстремумов. Следует, кроме того, ответить на вопрос о влиянии на достоверность прогноза длины обрабатываемой последовательности. Исследование выполняется путем программного эксперимента на основе исторических данных биржевых валютных торгов с фиксированием статистики результатов.

Цель эксперимента – оценить достоверность прогноза разворота тренда в зависимости от эвристических значений параметров исследуемого метода.

Результаты программных экспериментов по влиянию значений входных параметров на достоверность прогноза разворота тренда. Проведен экспериментальный анализ последовательностей оцифрованных данных валютных торгов Forex на бирже finam. В соответствии с принципами теории Ч. Доу рассматривается цена закрытия валютной пары [2, с. 18]. Для определенности анализируется цена закрытия валютной пары AUD/CAD (австралийский доллар к канадскому доллару) за период с 28 ноября 2001 г. по 6 марта 2017 г. с временным интервалом равным одной минуте. Как отмечено выше, обработка данных выполняется с помощью алгоритма идентификации экстремальных элементов последовательности на основе устойчивой адресной сортировки. Ниже представлена статистика достоверности прогнозов разворота тренда в зависимости от значений параметров алгоритма на примере указанных исторических данных. В качестве входных последовательностей рассмотрены массивы из 43200 чисел в формате float (значения цены закрытия за 30 дней с минутным интервалом) на различных временных интервалах между 2001-11-28 00:00:00 и 2017-03-06 00:00:00. Исследуемыми значениями параметров алгоритма являются начальные значения радиуса локализации, обозначаемые r0. При локализации минимумов начальное значение обозначается missing image file, аналогично при локализации максимумов – missing image file. В качестве исследуемого значения параметра, помимо того, рассматривается число count последовательных совпадений количества идентифицированных локальных минимумов или максимумов. При этом итерации по выделению экстремумов с фиксированным радиусом локализации повторяются до априори заданного значения count. Конечная цель эксперимента – выяснить, как влияют начальное значение радиуса локализации r0 и число последовательных совпадений количества экстремумов count для каждой из трех выполняемых итераций на правильность идентификации точек разворота тренда во входной последовательности цены закрытия валютной пары. Результат прогноза сопоставляется с количеством программно выделенных локальных минимумов minn (максимумов maxk), программно определенным значением радиуса локализации rmin (rmax) для каждой итерации и с положением (индексом) точек разворота тренда во входной последовательности: trendmin – разворот тренда со спада на подъем, trendmax – с подъема на спад соответственно. С учетом статистики это позволит выяснить влияние начальных значений параметров r0 и count на каждой итерации на достоверность прогноза разворота тренда. В табл. 1 представлены результаты эксперимента, выполненного для фиксированной входной последовательности a1, соответствующей временному интервалу [2001-11-29 00:00:00 и 2001-12-28 23:59:00] .

Согласно табл. 1 варьирование начальных параметров (в пределах представленных значений) практически не влияет на идентификацию разворота тренда.

Таблица 1

Результаты прогноза для последовательности a1 при различных значениях r0, count

№ итерации

Входные параметры

Значение программно подобранного радиуса локализации

Кол-во выделенных локальных экстремумов

Индексы точек разворота тренда

r0

count

rmin

rmax

minn

maxk

trendmin

trendmax

1.

1

1

3

107

137

152

109

15 215

26 178

2

1

2

10

10

7

8

3

1

2

3

3

3

2

2.

1

60

3

107

137

152

109

15 215

26 178

2

5

2

10

10

7

8

3

3

2

4

4

3

2

3.

1

120

3

149

137

106

109

15 215

26 178

2

30

2

31

31

4

3

3

6

2

7

7

1

1

4.

1

160

3

166

172

94

86

15 215

26 178

2

35

2

36

36

3

2

3

8

2

9

9

1

1

5.

1

2000

3

2002

2002

6

6

15 215

26 178

2

100

2

101

101

1

1

3

50

2

51

51

1

1

6.

1

1

5

168

139

95

108

15 215

26 178

2

1

4

15

11

4

5

3

1

2

5

3

1

2

7.

1

3

10

221

252

73

56

15 215

26 178

2

2

8

16

20

4

3

3

1

3

6

5

1

1

8.

1

20

100

341

366

40

41

15 215

26 178

2

15

20

40

34

2

2

3

3

5

7

7

1

1

На рис. 1 приведены графики, иллюстрирующие идентифицированные локальные экстремумы для каждой итерации и итоговые точки разворота тренда.

При измененном наборе значений параметров точка разворота тренда идентифицируется аналогично, как показано на рис. 2.

При новом наборе значений параметров точка разворота тренда идентифицируется по-прежнему на спад (рис. 3).

Аналогичные результаты получены для входных последовательностей, соответствующих различным временным интервалам фиксированной длины (43200 минут). В целом на основании эксперимента можно утверждать, что начальное значение радиуса локализации, варьируемое в ограниченных пределах, практически не влияет на идентификацию точек разворота тренда. Однако оно влияет на количество промежуточных локальных экстремумов на каждой итерации, а также на время работы программы, – заведомо большой начальный радиус позволяет сократить время работы функции по автоматическому подбору радиуса локализации. На этой основе в дальнейшем фиксируются начальные значения r0 для каждой из трех итераций соответственно равные 60, 5, 3. Такие параметры обеспечивают оптимальное время работы программы и сохранение достаточного количества промежуточной информации об экстремумах на каждой итерации для дальнейших исследований.

Следует отметить, что указанные значения r0 определены эвристически на основе результатов эксперимента по анализу цены закрытия валютной пары AUD/CAD с временным интервалом равным одной минуте.

missing image file

Рис. 1. Результат идентификации разворота тренда при входных значениях r0 = [1,1,1], count = [3,2,2]

missing image file

Рис. 2. Результат идентификации разворота тенденции при r0 = [120,30,6], count = [3,2,2]

missing image file

Рис. 3. Результат работы программы при входных значениях r0 = [100,20,5], count = [20,15,3]

В случае валютных пар с низкой волатильностью или при изменении таймфрейма значения r0, обеспечивающие оптимальное время работы программы и сохранение достаточного количества промежуточной информации об экстремумах на каждой итерации, всегда могут быть определены по результатам программного эксперимента с историческими биржевыми данными. Значения числа count последовательных совпадений количеств идентифицированных локальных минимумов (максимумов) массива, варьируемые в малых пределах, для функции по автоматическому подбору радиуса локализации также не вносят изменений в итоговую идентификацию точек разворота тренда. Значение count зависит от конкретной области применения алгоритма. В дальнейшем для сферы фондовых рынков были выбраны значения 3, 2, 2 для каждой из трех итераций соответственно, результаты исследования с таким выбором count описываются непосредственно ниже.

Зависимость программно идентифицированного радиуса локализации от длины входной последовательности. Исследуется зависимость программно идентифицированного радиуса локализации rmin (rmax) локальных минимумов (максимумов) на каждой итерации от количества элементов во входной последовательности. Эксперимент проведен на валютной паре AUD/CAD за период с 2001-11-28 00:00:00 по 2017-03-06 00:00:00 с временным интервалом равным 1 минуте. Начальные значения входных параметров на протяжении текущего эксперимента неизменны и равны r0 = [60,5,3], count = [3,2,2] соответственно для первой, второй и третьей итераций. Изменяется только количество элементов входной последовательности цены закрытия валютной пары. Результаты отражены в табл. 2.

Данные табл. 2 отражают рост значений автоматически подобранного радиуса локализации для первой итерации в зависимости от длины входной последовательности. Для второй итерации также характерна общая тенденция к увеличению радиуса локализации при увеличении числа элементов во входной последовательности, но она не так постоянна, встречаются случаи уменьшения значения радиуса локализации rmax при увеличении входной последовательности (эксперимент № 4 относительно эксперимента № 5). Для третьей итерации нет явной зависимости значения радиуса локализации и количества значений цены закрытия валютной пары во входной последовательности.

Таблица 2

Зависимость значений программно идентифицированных радиусов локализации rmin (rmax) при фиксированных параметрах (r0, count) от длины входной последовательности

№ итерации

Значение программно подобранного радиуса локализации

Число элементов во входной последовательности

Временной интервал, соответствующий входной последовательности

rmin

rmax

1.

1

86

70

20 160

2001-11-29 00:00:00

2001-12-12 23:59:00

2

9

8

3

5

5

2.

1

104

85

27 360

2001-11-29 00:00:00

2001-12-17 23:59:00

2

7

8

3

4

5

3.

1

104

85

34 560

2001-11-29 00:00:00

2001-12-22 23:59:00

2

7

9

3

4

5

4.

1

107

137

41 760

2001-11-29 00:00:00

2001-12-27 23:59:00

2

10

10

3

4

4

5.

1

110

145

51 840

2001-12-08 00:00:00

2002-01-12 23:59:00

2

12

8

3

4

4

6.

1

145

209

116 640

2001-12-08 00:00:00

2002-02-26 23:59:00

2

12

14

3

6

4

Результаты прогнозирования. Прогноз разворота тренда цены валютной пары на краткосрочный период реализуется по следующей методике (подробное описание алгоритма представлено в [1, с. 55–57]).

1. На вход алгоритма подается последовательность a цены закрытия валютной пары длины n с временным интервалом равным одной минуте.

2. Данная последовательность разделяется на тренировочную (входную) последовательность и тестовую – по индексу k выборки, то есть, missing image file – исторические данные, на основе анализа которых будет строиться прогноз, и missing image file – данные, на которых будет проверяться результат прогноза. Значение параметра k фиксировано.

3. На тренировочной выборке atrain осуществляется поиск информативных экстремумов на основе итерационного процесса. В результате заключительной (третьей) итерации фиксируются информативные экстремумы: trendmin – индексы точек информативных минимумов, trendmax – индексы точек информативных максимумов.

4. На основе фиксированных индексов и значений информативных экстремумов, полученных на выходе третьей итерации, наиболее близко расположенных к правой границе входной последовательности atrain, идентифицируется индекс точки разворота тренда trendfinal.

По описанной методике выполнен эксперимент по идентификации разворота тренда цены валютной пары AUD/CAD на краткосрочные периоды по историческим данным цены закрытия валютной пары за период с 2001-11-28 00:00:00 по 2017-03-06 00:00:00 с временным интервалом равным 1 минуте и выполнено прогнозирование цены на различные временные периоды. Принимается во внимание, что согласно М. Прингу важно использование фактора времени в комбинации с направлением движения цены для корректного определения разворота тренда [3, c. 3]. В [4, с. 2671] подтверждается, что наиболее простым и в то же время обладающим высокой степенью практической значимости является предложенное М. Прингом определение тренда как продолжительности направленного движения ценовых экстремумов. С учетом отмеченных факторов ниже представлены результаты прогноза на следующие временные интервалы – 2 ч, 24 ч, 48 ч, 168 ч. Значение k фиксируется равным 43 200, что соответствует количеству минут в 30 днях, то есть входная последовательность atrain состоит из 43 200 записей цены закрытия валютной вары AUD/CAD с временным интервалом равным одной минуте. Результаты эксперимента представлены в табл. 3.

Количество выполненных прогнозов – 11 346. Прогноз считается успешным, если значение цены закрытия валютной пары a[k+ℓ] (ℓ – число минут, на которые делается прогноз) больше (меньше) значения a[k] в случае восходящего (нисходящего) тренда. Значения процентов успешных прогнозов, представленных в табл. 3, допустимо считать сравнительно высокими, так, например, в [5, с. 128] как положительный результат отмечается 60 % успешных сделок, сгенерированных программой на основе разработанного авторами комплексного индикатора, одобренного к использованию в подразделении компании Deltix Inc.

Далее, проанализирована зависимость снижения успешности прогнозов от времени, прошедшего с момента выполнения прогноза (в принятых обозначениях a[k] + t). В табл. 4 отображена зависимость количества сохраняющих успешность прогнозов от времени, прошедшего с момента выполнения прогноза.

Очевидна тенденция снижения успешности прогнозов с ростом времени, прошедшего с момента выполнения прогноза. Поэтому рекомендуется открывать сделку в момент получения сигнала, в противном случае по мере удаления во времени вероятность благополучного закрытия сделки снижается.

Таблица 3

Оценка достоверности прогноза цены закрытия валютной пары AUD/CAD за период с 2001-11-28 00:00:00 по 2017-03-06 00:00:00 с временным интервалом равным 1 минуте

 

2 ч

24 ч

48 ч

168 ч

Доля успешных прогнозов (в %)

69,9 %

68,7 %

70,1 %

71,5 %

Таблица 4

Зависимость успешности прогнозов от времени, прошедшего после выполнения прогноза

Время, прошедшее с момента

появления точки разворота, t

2 ч

24 ч

48 ч

168 ч

1

65,8 %

59,3 %

64 %

68, %

5

65,5 %

56,9 %

59,7 %

66,5 %

10

59,8 %

57,5 %

59,3 %

65,1 %

15

56,1 %

56,1 %

57,7 %

63,4 %

20

55,1 %

55,1 %

56,2 %

63 %

25

55,6 %

54,4 %

56,8 %

62,8 %

30

53,4 %

54 %

55,9 %

62,8 %

35

51,3 %

54,1 %

56,2 %

63,8 %

40

59,6 %

54 %

56,9 %

62 %

45

51,8 %

54 %

56,2 %

62,2 %

50

50,7 %

51,5 %

55,4 %

61,7 %

55

50,4 %

52 %

54,4 %

62,4 %

60

52,6 %

50,9 %

55,9 %

61,4 %

Особенности прогнозирования в режиме реального времени. Согласно табл. 4 для прогноза на краткосрочный период целесообразно максимально быстрое обнаружение точки разворота тренда. Возникает задача снижения времени работы программы, реализующей поиск информативных экстремумов и выделение точек разворота тенденции. Как отмечалось, сократить время выполнения функции по автоматическому подбору радиуса локализации позволяет фиксирование заведомо большого значения начального радиуса локализации, которое может быть определено на основе программного эксперимента с историческими биржевыми данными. Помимо функции по автоматическому подбору радиуса локализации существенную часть времени работы программы занимает выполнение функции, реализующей сортировку последовательности atrain. Снизить время работы данной функции в общем случае можно применением быстрой сортировки [6, c. 174–179]. Поэтому в рассматриваемой работе при исследовании применялась сортировка слиянием. Ее последовательное выполнение имеет временную сложность O(nlog2n). В частном случае, при добавлении существенно меньшего числа новых данных в сравнении с отсортированными для предыдущего прогноза, можно заменить функцию сортировки полного массива функцией, реализующей следующий алгоритм. Пусть для текущего прогноза входная последовательность представлена одномерным числовым массивом missing image file. Для определенности пусть n = 43200, как в представленном выше эксперименте. В ходе обработки последовательности a формируется массив входных индексов missing image file, расположенных в порядке отсортированных элементов [1, с. 53–54]. С помощью массива e идентифицируются информативные экстремумы. Для нового прогноза, выполняемого, например, через 60 мин, входная последовательность определяется числовым массивом missing image file, где ℓ = 60. В этом случае дополнительный массив индексов a(new) можно построить без сортировки всех элементов массива a(new). Именно, выполняется сортировка добавленных элементов missing image file. Для них формируется соответственный массив входных индексов missing image file. Искомый новый массив a(new) формируется по принципу слияния с добавлением индексов missing image file в соответственные позиции в порядке окончательно упорядоченных элементов. Начальные ℓ = 60 элементов полного нового массива после слияния можно исключить, поскольку согласно эксперименту длина последовательности, начиная с некоторого значения, не влияет на достоверность прогноза. Используется алгоритм слияния, который входит в сортировку слиянием и, так же как эта сортировка, сохраняет взаимно однозначное соответствие входных и выходных индексов упорядочиваемых элементов. В последовательном выполнении его временная сложность составляет O(n). Можно отметить, что на основе рассматриваемого подхода фигуры технического анализа идентифицируются практически полностью достоверно [7, с. 1]. Кроме того, сортировка слиянием может быть существенно ускорена за счет того, что она эффективно распараллеливается с временной сложностью O(log2n), при этом само слияние устойчиво и распараллеливается с временной сложностью O(1) [8, с. 87–90].

Заключение

В рамках подхода к идентификации разворота тренда на основе устойчивой адресной сортировки исследовано влияние значений параметров метода на достоверность прогноза. В частности, показано, что на достоверность прогноза практически не влияют вариации в широких пределах начальных значений радиусов локализации экстремумов. Аналогично, не сказываются на результатах прогноза малые вариации значений количества итерационно повторяющегося конечного множества локальных экстремумов. Рост длины обрабатываемой последовательности, начиная с некоторого значения, не оказывает никакого влияния на достоверность прогноза. Исследование выполнено на основе исторических данных биржевых валютных торгов и показало достоверность прогноза в пределах 70 %.