|
NEU-2001
ГЕНОМ КАК АПЕРИОДИЧЕСКИЙ ОДНОМЕРНЫЙ КРИСТАЛЛ
♠В.К. Гуляев, ¶М.Г. Садовский
♠Институт физики им.Л.В.Киренского СО РАН, comp@academ.ru
¶Институт биофизики СО РАН, msad@icm.krasn.ru
Живое может рассматриваться
как апериодический кристалл — структура со сравнительно простым правилом
чередования набора “элементарных” фрагментов, которые “в среднем поровну”
представлены во всей рассматриваемой структуре [1]. Аналогичные апериодические
структуры встречаются и в иных областях естествознания, например, в
кристаллографии [2]. Работа посвящена поиску, выделению и описанию структур,
которые можно было бы считать апериодическими одномерными кристаллами в
нуклеотидных последовательностях (НП).
При поиске и выделении в НП апериодических структур возникает
естественный вопрос о том, что считать “элементарным” фрагментом: будет ли это
отдельный нуклеотид, или k–плет, или же “элементарными” фрагментами
будет набор k–плетов различной длины. Биологические соображения
подсказывают, что характерное число таких элементарных фрагментов составляет
порядка 100, а их длина может меняться от 3 нуклеотидов до фрагментов длины
порядка 100 нуклеотидов.
В то время как
восстановление периодической дискретной структуры по элементарному фрагменту
либо периодической непрерывной функции заданной на интервале равном длине
периода не вызывают затруднения. На первый взгляд непонятно можно ли, например,
восстановить апериодическую функцию по заданному фрагменту и если да то какой
длины должен быть фрагмент. Так же интересен вопрос можно ли описать
квазипериодическую дискретную структуру методом, который бы включал метод
описания периодической структуры как частный простейший случай. Исследованию
указанных проблем посвящена наша работа.
Начнём рассмотрение с непрерывного случая. Пусть имеется
k непрерывных гладких функций
,
i = 1,2,...,k, определённых каждая на отрезке
0 ≤ x < Ti, где все
Ti несоизмеримы друг с другом; пусть
— k периодических
функций, определённых на всей положительной полуоси. Тогда
является непериодической функцией.
Пусть теперь нам известна только функция Ψ и значения Ti.
Тогда эта функция инвариантна относительно преобразования,
задаваемого оператором
|
| (1) |
где Ai — оператор сдвига,
определяемый следующим образом:
|
| (2) |
Тем самым, задача изучения функции Ψ, “подозрительной” на
квазипериодичность сводится к поиску таких периодов {Ti},
которые бы позволяли восстанавливать функцию Ψ, заданную на интервале
. Очевидно, что если все периоды
{Ti} известны и функция Ψ задана на интервале T,
то функция восстанавливается на всей прямой. Необходимо отметить, что оператор
трансляции A для функции Ψ не совпадает с оператором сдвига и к тому
же является многоточечным в отличие от оператора
трансляции для периодических функций.
В качестве второго примера рассмотрим классическую дискретную
апериодическую последовательность [3, 4] нулей и единиц:
|
| (3) |
где β – произвольное число,
σ >1 — иррациональное число. В данной
последовательности отношение числа единиц к числу нулей равно
1 / (σ - 1). Обобщением указанной последовательности
будет набор следующих последовательностей [2] нулей и единиц
|
| (4) |
где
, J = max( j).
Частота единиц в таких последовательностях равна
, поэтому для апериодической
последовательностей букв можно надеяться восстановить вид функций (3)
статистическими информационными методами [5].
Описанная методология может быть также применена к анализу
квазипериодичности НП. Для символьных последовательностей несоизмеримость
отрезков следует заменить на выбор таких слов ωi,
i = 1,2,...,k (соответствующих функциям
), длины которых взаимно просты.
В случае использования дискретного метода к анализу квазипериодичности НП
следует использовать статистические информационные методы для определения
набора {δi}, варьируя значения наименьшего общего
кратного длин слов ωi. Другим важным параметром
“настройки” при выделении и описании апериодических структур в НП является
число k таких “элементарных” слов. Собственно задача анализа НП с целью
поиска и выделения в ней апериодической структурированности ставится следующим
образом:
- Для заданного семейства НП выделить и описать наименьший возможный набор
“элементарных” слов, либо набор “элементарных” слов длины менее некоторой
заданной l*, порождающий всю НП.
- Для заданного семейства НП выделить и описать наименьший возможный набор
“элементарных” слов суммарной длины менее l*, порождающий
всю НП.
Данный подход к анализу апериодической структурированности НП
был применён нами к набору последовательностей геномов некоторых вирусов, а
также к последовательностям, кодирующим отдельные гены.
Литература.
[1] Э.Шрёдингер Что такое жизнь? С точки зрения физика. М.:
Глав.ред.физ.-мат.лит., 1948, 278 с.
[2] Гуляев В.К. Квазикристаллы:
определение координат атомов в аналитическом виде // Препринт ИФ СО РАН №
799-Ф, Красноярск, 2000, 38 с.
[3] E. N. Gilbert, Amer. Math. Monthly, 1963. V.
70. PP.736-738.
[4] A. S. Fraenkel, Canad. J. Math. 1969. V. 21. Pp. 6-27.
[5] Bugaenko N.N., Gorban A.N., Sadovsky M.G.
(1998). Maximum entropy method in analysis of genetic text and measurement of
its information content // Open System & Information Dynamics, vol.5, № 3, pp.265
– 278.
|