Scientific journal
Modern high technologies
ISSN 1812-7320
"Перечень" ВАК
ИФ РИНЦ = 0,899

В общем случае, генетический текст можно представить как последовательность элементов четырех видов. Сложность такой последовательности состоит в том, что структура последовательности является непостоянной, участки произвольной длины в нем смещаются относительно друг друга случайным образом, т.е. данные имеют нечеткую структуру. Очевидно, что для представления такого рода данных необходимо сжатие информации.

Для решения проблем описания таких данных предложено представлять их в виде спектра с использованием комплексной системы импульсных функций.

Проанализированы 16 функционально идентичных нуклеотидных последовательностей гена «mef2a» разных организмов (DQ323505.1, NM_001014035.1, AK153751.1, BC096598.1, XM_001489154.1, XM_852945.1, NM_001099698.1, XM_001103453.1, NM_001083638.1, XM_001140333.1, BC013437.2, XM_001507528.1, XM_001478863.1, NM_204864.1, DQ977554.1, AB012884.1 - индексы последовательностей базы данных GenBank). Выборка первых 13 последовательностей с процентом схожести от 99% до 83%, осуществлялась с помощью программы BLAST (на базе последовательности DQ323505.1).

Найденные коэффициенты корреляции Пирсона полученных спектральных портретов последовательностей составили от 0.96 до 0.99. Кроме того, были проанализированы следующие последовательности, для которых программой BLAST не найдено соответствие: NM_204864.1, DQ977554.1, AB012884.1. Коэффициенты корреляции Пирсона полученных спектральных портретов данных последовательностей с последовательностью DQ323505.1 составили 0,99; 0,99; 0,97 соответственно.

Полученные результаты свидетельствуют о том, что применение данного метода позволяет выделять образы, которые довольно точно описывают функциональную принадлежность нуклеотидной последовательности. Также метод чувствителен к многочисленным сдвигам внутри нуклеотидной последовательности, и позволяет получить описание структуры сигнала при его большой зашумлености.