Введение
Обработка данных биржевых валютных торгов выполняется с помощью алгоритма идентификации экстремальных элементов последовательности на основе устойчивой адресной сортировки, алгоритм детально описан в [1, с. 53–59]. Сортировка при этом должна обладать взаимно однозначным соответствием входных и выходных индексов сортируемых элементов. Существо метода состоит в следующем. В любой числовой последовательности из N элементов используемая сортировка позволяет выделить все локально минимальные элементы для произвольно заданного радиуса локализации согласно условию
,
где каждый локально минимальный элемент с входным индексом ek, 1 ≤ k ≤ N, в произвольном радиусе локализации r = ε0 идентифицируется непосредственно по построению, если индексы ek располагаются в порядке отсортированных элементов. Аналогично локально максимальные элементы идентифицируются по условию
.
С помощью этих условий, с использованием итераций, выделяются именно те существенные (информативные) экстремумы, которые определяют разворот тренда. Если последний слева направо из определяющих экстремумов является максимумом вблизи конца последовательности, то ее продолжение соответствует развороту тренда к спаду. Если последний из таких экстремумов является минимумом вблизи конца последовательности, то ее продолжение соответствует развороту тренда к подъему. Если такой экстремум идентифицирован непосредственно на правой границе последовательности, то это может быть признаком продолжения тренда. В рамках данного подхода необходимо знать, как влияют на достоверность прогноза значения параметров метода. В частности, ставится вопрос, как влияют на достоверность априори задаваемые начальные значения радиусов локализации экстремумов. Аналогичный вопрос ставится по отношению к параметрическому количеству итерационно повторяющихся локальных экстремумов. Следует, кроме того, ответить на вопрос о влиянии на достоверность прогноза длины обрабатываемой последовательности. Исследование выполняется путем программного эксперимента на основе исторических данных биржевых валютных торгов с фиксированием статистики результатов.
Цель эксперимента – оценить достоверность прогноза разворота тренда в зависимости от эвристических значений параметров исследуемого метода.
Результаты программных экспериментов по влиянию значений входных параметров на достоверность прогноза разворота тренда. Проведен экспериментальный анализ последовательностей оцифрованных данных валютных торгов Forex на бирже finam. В соответствии с принципами теории Ч. Доу рассматривается цена закрытия валютной пары [2, с. 18]. Для определенности анализируется цена закрытия валютной пары AUD/CAD (австралийский доллар к канадскому доллару) за период с 28 ноября 2001 г. по 6 марта 2017 г. с временным интервалом равным одной минуте. Как отмечено выше, обработка данных выполняется с помощью алгоритма идентификации экстремальных элементов последовательности на основе устойчивой адресной сортировки. Ниже представлена статистика достоверности прогнозов разворота тренда в зависимости от значений параметров алгоритма на примере указанных исторических данных. В качестве входных последовательностей рассмотрены массивы из 43200 чисел в формате float (значения цены закрытия за 30 дней с минутным интервалом) на различных временных интервалах между 2001-11-28 00:00:00 и 2017-03-06 00:00:00. Исследуемыми значениями параметров алгоритма являются начальные значения радиуса локализации, обозначаемые r0. При локализации минимумов начальное значение обозначается , аналогично при локализации максимумов – . В качестве исследуемого значения параметра, помимо того, рассматривается число count последовательных совпадений количества идентифицированных локальных минимумов или максимумов. При этом итерации по выделению экстремумов с фиксированным радиусом локализации повторяются до априори заданного значения count. Конечная цель эксперимента – выяснить, как влияют начальное значение радиуса локализации r0 и число последовательных совпадений количества экстремумов count для каждой из трех выполняемых итераций на правильность идентификации точек разворота тренда во входной последовательности цены закрытия валютной пары. Результат прогноза сопоставляется с количеством программно выделенных локальных минимумов minn (максимумов maxk), программно определенным значением радиуса локализации rmin (rmax) для каждой итерации и с положением (индексом) точек разворота тренда во входной последовательности: trendmin – разворот тренда со спада на подъем, trendmax – с подъема на спад соответственно. С учетом статистики это позволит выяснить влияние начальных значений параметров r0 и count на каждой итерации на достоверность прогноза разворота тренда. В табл. 1 представлены результаты эксперимента, выполненного для фиксированной входной последовательности a1, соответствующей временному интервалу [2001-11-29 00:00:00 и 2001-12-28 23:59:00] .
Согласно табл. 1 варьирование начальных параметров (в пределах представленных значений) практически не влияет на идентификацию разворота тренда.
Таблица 1
Результаты прогноза для последовательности a1 при различных значениях r0, count
№ |
№ итерации |
Входные параметры |
Значение программно подобранного радиуса локализации |
Кол-во выделенных локальных экстремумов |
Индексы точек разворота тренда |
||||
r0 |
count |
rmin |
rmax |
minn |
maxk |
trendmin |
trendmax |
||
1. |
1 |
1 |
3 |
107 |
137 |
152 |
109 |
15 215 |
26 178 |
2 |
1 |
2 |
10 |
10 |
7 |
8 |
|||
3 |
1 |
2 |
3 |
3 |
3 |
2 |
|||
2. |
1 |
60 |
3 |
107 |
137 |
152 |
109 |
15 215 |
26 178 |
2 |
5 |
2 |
10 |
10 |
7 |
8 |
|||
3 |
3 |
2 |
4 |
4 |
3 |
2 |
|||
3. |
1 |
120 |
3 |
149 |
137 |
106 |
109 |
15 215 |
26 178 |
2 |
30 |
2 |
31 |
31 |
4 |
3 |
|||
3 |
6 |
2 |
7 |
7 |
1 |
1 |
|||
4. |
1 |
160 |
3 |
166 |
172 |
94 |
86 |
15 215 |
26 178 |
2 |
35 |
2 |
36 |
36 |
3 |
2 |
|||
3 |
8 |
2 |
9 |
9 |
1 |
1 |
|||
5. |
1 |
2000 |
3 |
2002 |
2002 |
6 |
6 |
15 215 |
26 178 |
2 |
100 |
2 |
101 |
101 |
1 |
1 |
|||
3 |
50 |
2 |
51 |
51 |
1 |
1 |
|||
6. |
1 |
1 |
5 |
168 |
139 |
95 |
108 |
15 215 |
26 178 |
2 |
1 |
4 |
15 |
11 |
4 |
5 |
|||
3 |
1 |
2 |
5 |
3 |
1 |
2 |
|||
7. |
1 |
3 |
10 |
221 |
252 |
73 |
56 |
15 215 |
26 178 |
2 |
2 |
8 |
16 |
20 |
4 |
3 |
|||
3 |
1 |
3 |
6 |
5 |
1 |
1 |
|||
8. |
1 |
20 |
100 |
341 |
366 |
40 |
41 |
15 215 |
26 178 |
2 |
15 |
20 |
40 |
34 |
2 |
2 |
|||
3 |
3 |
5 |
7 |
7 |
1 |
1 |
На рис. 1 приведены графики, иллюстрирующие идентифицированные локальные экстремумы для каждой итерации и итоговые точки разворота тренда.
При измененном наборе значений параметров точка разворота тренда идентифицируется аналогично, как показано на рис. 2.
При новом наборе значений параметров точка разворота тренда идентифицируется по-прежнему на спад (рис. 3).
Аналогичные результаты получены для входных последовательностей, соответствующих различным временным интервалам фиксированной длины (43200 минут). В целом на основании эксперимента можно утверждать, что начальное значение радиуса локализации, варьируемое в ограниченных пределах, практически не влияет на идентификацию точек разворота тренда. Однако оно влияет на количество промежуточных локальных экстремумов на каждой итерации, а также на время работы программы, – заведомо большой начальный радиус позволяет сократить время работы функции по автоматическому подбору радиуса локализации. На этой основе в дальнейшем фиксируются начальные значения r0 для каждой из трех итераций соответственно равные 60, 5, 3. Такие параметры обеспечивают оптимальное время работы программы и сохранение достаточного количества промежуточной информации об экстремумах на каждой итерации для дальнейших исследований.
Следует отметить, что указанные значения r0 определены эвристически на основе результатов эксперимента по анализу цены закрытия валютной пары AUD/CAD с временным интервалом равным одной минуте.
Рис. 1. Результат идентификации разворота тренда при входных значениях r0 = [1,1,1], count = [3,2,2]
Рис. 2. Результат идентификации разворота тенденции при r0 = [120,30,6], count = [3,2,2]
Рис. 3. Результат работы программы при входных значениях r0 = [100,20,5], count = [20,15,3]
В случае валютных пар с низкой волатильностью или при изменении таймфрейма значения r0, обеспечивающие оптимальное время работы программы и сохранение достаточного количества промежуточной информации об экстремумах на каждой итерации, всегда могут быть определены по результатам программного эксперимента с историческими биржевыми данными. Значения числа count последовательных совпадений количеств идентифицированных локальных минимумов (максимумов) массива, варьируемые в малых пределах, для функции по автоматическому подбору радиуса локализации также не вносят изменений в итоговую идентификацию точек разворота тренда. Значение count зависит от конкретной области применения алгоритма. В дальнейшем для сферы фондовых рынков были выбраны значения 3, 2, 2 для каждой из трех итераций соответственно, результаты исследования с таким выбором count описываются непосредственно ниже.
Зависимость программно идентифицированного радиуса локализации от длины входной последовательности. Исследуется зависимость программно идентифицированного радиуса локализации rmin (rmax) локальных минимумов (максимумов) на каждой итерации от количества элементов во входной последовательности. Эксперимент проведен на валютной паре AUD/CAD за период с 2001-11-28 00:00:00 по 2017-03-06 00:00:00 с временным интервалом равным 1 минуте. Начальные значения входных параметров на протяжении текущего эксперимента неизменны и равны r0 = [60,5,3], count = [3,2,2] соответственно для первой, второй и третьей итераций. Изменяется только количество элементов входной последовательности цены закрытия валютной пары. Результаты отражены в табл. 2.
Данные табл. 2 отражают рост значений автоматически подобранного радиуса локализации для первой итерации в зависимости от длины входной последовательности. Для второй итерации также характерна общая тенденция к увеличению радиуса локализации при увеличении числа элементов во входной последовательности, но она не так постоянна, встречаются случаи уменьшения значения радиуса локализации rmax при увеличении входной последовательности (эксперимент № 4 относительно эксперимента № 5). Для третьей итерации нет явной зависимости значения радиуса локализации и количества значений цены закрытия валютной пары во входной последовательности.
Таблица 2
Зависимость значений программно идентифицированных радиусов локализации rmin (rmax) при фиксированных параметрах (r0, count) от длины входной последовательности
№ |
№ итерации |
Значение программно подобранного радиуса локализации |
Число элементов во входной последовательности |
Временной интервал, соответствующий входной последовательности |
|
rmin |
rmax |
||||
1. |
1 |
86 |
70 |
20 160 |
2001-11-29 00:00:00 2001-12-12 23:59:00 |
2 |
9 |
8 |
|||
3 |
5 |
5 |
|||
2. |
1 |
104 |
85 |
27 360 |
2001-11-29 00:00:00 2001-12-17 23:59:00 |
2 |
7 |
8 |
|||
3 |
4 |
5 |
|||
3. |
1 |
104 |
85 |
34 560 |
2001-11-29 00:00:00 2001-12-22 23:59:00 |
2 |
7 |
9 |
|||
3 |
4 |
5 |
|||
4. |
1 |
107 |
137 |
41 760 |
2001-11-29 00:00:00 2001-12-27 23:59:00 |
2 |
10 |
10 |
|||
3 |
4 |
4 |
|||
5. |
1 |
110 |
145 |
51 840 |
2001-12-08 00:00:00 2002-01-12 23:59:00 |
2 |
12 |
8 |
|||
3 |
4 |
4 |
|||
6. |
1 |
145 |
209 |
116 640 |
2001-12-08 00:00:00 2002-02-26 23:59:00 |
2 |
12 |
14 |
|||
3 |
6 |
4 |
Результаты прогнозирования. Прогноз разворота тренда цены валютной пары на краткосрочный период реализуется по следующей методике (подробное описание алгоритма представлено в [1, с. 55–57]).
1. На вход алгоритма подается последовательность a цены закрытия валютной пары длины n с временным интервалом равным одной минуте.
2. Данная последовательность разделяется на тренировочную (входную) последовательность и тестовую – по индексу k выборки, то есть, – исторические данные, на основе анализа которых будет строиться прогноз, и – данные, на которых будет проверяться результат прогноза. Значение параметра k фиксировано.
3. На тренировочной выборке atrain осуществляется поиск информативных экстремумов на основе итерационного процесса. В результате заключительной (третьей) итерации фиксируются информативные экстремумы: trendmin – индексы точек информативных минимумов, trendmax – индексы точек информативных максимумов.
4. На основе фиксированных индексов и значений информативных экстремумов, полученных на выходе третьей итерации, наиболее близко расположенных к правой границе входной последовательности atrain, идентифицируется индекс точки разворота тренда trendfinal.
По описанной методике выполнен эксперимент по идентификации разворота тренда цены валютной пары AUD/CAD на краткосрочные периоды по историческим данным цены закрытия валютной пары за период с 2001-11-28 00:00:00 по 2017-03-06 00:00:00 с временным интервалом равным 1 минуте и выполнено прогнозирование цены на различные временные периоды. Принимается во внимание, что согласно М. Прингу важно использование фактора времени в комбинации с направлением движения цены для корректного определения разворота тренда [3, c. 3]. В [4, с. 2671] подтверждается, что наиболее простым и в то же время обладающим высокой степенью практической значимости является предложенное М. Прингом определение тренда как продолжительности направленного движения ценовых экстремумов. С учетом отмеченных факторов ниже представлены результаты прогноза на следующие временные интервалы – 2 ч, 24 ч, 48 ч, 168 ч. Значение k фиксируется равным 43 200, что соответствует количеству минут в 30 днях, то есть входная последовательность atrain состоит из 43 200 записей цены закрытия валютной вары AUD/CAD с временным интервалом равным одной минуте. Результаты эксперимента представлены в табл. 3.
Количество выполненных прогнозов – 11 346. Прогноз считается успешным, если значение цены закрытия валютной пары a[k+ℓ] (ℓ – число минут, на которые делается прогноз) больше (меньше) значения a[k] в случае восходящего (нисходящего) тренда. Значения процентов успешных прогнозов, представленных в табл. 3, допустимо считать сравнительно высокими, так, например, в [5, с. 128] как положительный результат отмечается 60 % успешных сделок, сгенерированных программой на основе разработанного авторами комплексного индикатора, одобренного к использованию в подразделении компании Deltix Inc.
Далее, проанализирована зависимость снижения успешности прогнозов от времени, прошедшего с момента выполнения прогноза (в принятых обозначениях a[k] + t). В табл. 4 отображена зависимость количества сохраняющих успешность прогнозов от времени, прошедшего с момента выполнения прогноза.
Очевидна тенденция снижения успешности прогнозов с ростом времени, прошедшего с момента выполнения прогноза. Поэтому рекомендуется открывать сделку в момент получения сигнала, в противном случае по мере удаления во времени вероятность благополучного закрытия сделки снижается.
Таблица 3
Оценка достоверности прогноза цены закрытия валютной пары AUD/CAD за период с 2001-11-28 00:00:00 по 2017-03-06 00:00:00 с временным интервалом равным 1 минуте
2 ч |
24 ч |
48 ч |
168 ч |
|
Доля успешных прогнозов (в %) |
69,9 % |
68,7 % |
70,1 % |
71,5 % |
Таблица 4
Зависимость успешности прогнозов от времени, прошедшего после выполнения прогноза
Время, прошедшее с момента появления точки разворота, t |
2 ч |
24 ч |
48 ч |
168 ч |
1 |
65,8 % |
59,3 % |
64 % |
68, % |
5 |
65,5 % |
56,9 % |
59,7 % |
66,5 % |
10 |
59,8 % |
57,5 % |
59,3 % |
65,1 % |
15 |
56,1 % |
56,1 % |
57,7 % |
63,4 % |
20 |
55,1 % |
55,1 % |
56,2 % |
63 % |
25 |
55,6 % |
54,4 % |
56,8 % |
62,8 % |
30 |
53,4 % |
54 % |
55,9 % |
62,8 % |
35 |
51,3 % |
54,1 % |
56,2 % |
63,8 % |
40 |
59,6 % |
54 % |
56,9 % |
62 % |
45 |
51,8 % |
54 % |
56,2 % |
62,2 % |
50 |
50,7 % |
51,5 % |
55,4 % |
61,7 % |
55 |
50,4 % |
52 % |
54,4 % |
62,4 % |
60 |
52,6 % |
50,9 % |
55,9 % |
61,4 % |
Особенности прогнозирования в режиме реального времени. Согласно табл. 4 для прогноза на краткосрочный период целесообразно максимально быстрое обнаружение точки разворота тренда. Возникает задача снижения времени работы программы, реализующей поиск информативных экстремумов и выделение точек разворота тенденции. Как отмечалось, сократить время выполнения функции по автоматическому подбору радиуса локализации позволяет фиксирование заведомо большого значения начального радиуса локализации, которое может быть определено на основе программного эксперимента с историческими биржевыми данными. Помимо функции по автоматическому подбору радиуса локализации существенную часть времени работы программы занимает выполнение функции, реализующей сортировку последовательности atrain. Снизить время работы данной функции в общем случае можно применением быстрой сортировки [6, c. 174–179]. Поэтому в рассматриваемой работе при исследовании применялась сортировка слиянием. Ее последовательное выполнение имеет временную сложность O(nlog2n). В частном случае, при добавлении существенно меньшего числа новых данных в сравнении с отсортированными для предыдущего прогноза, можно заменить функцию сортировки полного массива функцией, реализующей следующий алгоритм. Пусть для текущего прогноза входная последовательность представлена одномерным числовым массивом . Для определенности пусть n = 43200, как в представленном выше эксперименте. В ходе обработки последовательности a формируется массив входных индексов , расположенных в порядке отсортированных элементов [1, с. 53–54]. С помощью массива e идентифицируются информативные экстремумы. Для нового прогноза, выполняемого, например, через 60 мин, входная последовательность определяется числовым массивом , где ℓ = 60. В этом случае дополнительный массив индексов a(new) можно построить без сортировки всех элементов массива a(new). Именно, выполняется сортировка добавленных элементов . Для них формируется соответственный массив входных индексов . Искомый новый массив a(new) формируется по принципу слияния с добавлением индексов в соответственные позиции в порядке окончательно упорядоченных элементов. Начальные ℓ = 60 элементов полного нового массива после слияния можно исключить, поскольку согласно эксперименту длина последовательности, начиная с некоторого значения, не влияет на достоверность прогноза. Используется алгоритм слияния, который входит в сортировку слиянием и, так же как эта сортировка, сохраняет взаимно однозначное соответствие входных и выходных индексов упорядочиваемых элементов. В последовательном выполнении его временная сложность составляет O(n). Можно отметить, что на основе рассматриваемого подхода фигуры технического анализа идентифицируются практически полностью достоверно [7, с. 1]. Кроме того, сортировка слиянием может быть существенно ускорена за счет того, что она эффективно распараллеливается с временной сложностью O(log2n), при этом само слияние устойчиво и распараллеливается с временной сложностью O(1) [8, с. 87–90].
Заключение
В рамках подхода к идентификации разворота тренда на основе устойчивой адресной сортировки исследовано влияние значений параметров метода на достоверность прогноза. В частности, показано, что на достоверность прогноза практически не влияют вариации в широких пределах начальных значений радиусов локализации экстремумов. Аналогично, не сказываются на результатах прогноза малые вариации значений количества итерационно повторяющегося конечного множества локальных экстремумов. Рост длины обрабатываемой последовательности, начиная с некоторого значения, не оказывает никакого влияния на достоверность прогноза. Исследование выполнено на основе исторических данных биржевых валютных торгов и показало достоверность прогноза в пределах 70 %.