Для решения проблем описания таких данных предложено представлять их в виде спектра с использованием комплексной системы импульсных функций.
Проанализированы 16 функционально идентичных нуклеотидных последовательностей гена «mef2a» разных организмов (DQ323505.1, NM_001014035.1, AK153751.1, BC096598.1, XM_001489154.1, XM_852945.1, NM_001099698.1, XM_001103453.1, NM_001083638.1, XM_001140333.1, BC013437.2, XM_001507528.1, XM_001478863.1, NM_204864.1, DQ977554.1, AB012884.1 - индексы последовательностей базы данных GenBank). Выборка первых 13 последовательностей с процентом схожести от 99% до 83%, осуществлялась с помощью программы BLAST (на базе последовательности DQ323505.1).
Найденные коэффициенты корреляции Пирсона полученных спектральных портретов последовательностей составили от 0.96 до 0.99. Кроме того, были проанализированы следующие последовательности, для которых программой BLAST не найдено соответствие: NM_204864.1, DQ977554.1, AB012884.1. Коэффициенты корреляции Пирсона полученных спектральных портретов данных последовательностей с последовательностью DQ323505.1 составили 0,99; 0,99; 0,97 соответственно.
Полученные результаты свидетельствуют о том, что применение данного метода позволяет выделять образы, которые довольно точно описывают функциональную принадлежность нуклеотидной последовательности. Также метод чувствителен к многочисленным сдвигам внутри нуклеотидной последовательности, и позволяет получить описание структуры сигнала при его большой зашумлености.