На початковому етапі виникнення життя на Землі існували тільки РНК, а ДНК з’явилися вже в результаті їх еволюції

Група російських фізиків з ФІАН, МФТІ і МДУ розробила новий метод порівняння двох молекул РНК, заснований на математичному схожості методу динамічного програмування і теорії, що описує утворення комплексу двох полімерних ланцюгів зі складною архітектурою. Цей метод може допомогти передбачати “оптимальну” вторинну структуру молекули РНК послідовності утворюють її нуклеотидів. Несподіваним наслідком розробленого підходу (для найпростішої моделі РНК) стала гіпотеза про статистичному механізмі выделенности використовуваного природою числа нуклеотидів – 4.

Для еволюційної біології питання порівняння послідовностей ДНК і РНК – один з ключових, зокрема, він дозволяє судити про те, наскільки далеко в еволюційному сенсі розійшлися один від одного два розглянутих гена, і які гени можуть бути їх спільними предками. І якщо питання порівняння двох послідовностей молекул дезоксирибонуклеїнової кислоти (ДНК) з алгоритмічної точки зору не викликає принципових труднощів, то завдання побудови алгоритму порівняння молекул рибонуклеїнової кислоти (РНК) наштовхується на серйозні перешкоди і незважаючи на значний прогрес в цій області, до цих пір повністю не вирішена. Справа в тому, що молекули РНК містять нетривіальну вторинну структуру типу “клеверного листа” або “кактуса”. Освіта цієї вторинної структури обумовлено наявністю слабких водневих зв’язків між віддаленими по ланцюгу компліментарними нуклеотидами.

Сергій Нечаєв (ФІАН), Михайло Тамм (МДУ) та Ольга Вальба (МФТІ) пропонують метод порівняння РНК, явно враховує послідовність нуклеотидів, так і комбінаторику, обумовлену тим, що при заданій первинній структурі молекула РНК може утворити різні вторинні кактусоподобные структури.

“Молекули ДНК і РНК – це нерегулярні послідовності, утворені чотирьох типів “букв” – нуклеотидів. Завдання порівняння або, як кажуть, “вирівнювання” послідовностей молекул ДНК, полягає в знаходженні максимальної загальної підпослідовності двох молекул. Ця підпослідовність не обов’язково складається з йдуть безпосередньо один за одним букв, вони можуть йти і з пробілами – делециями. Завдання про порівняння двох послідовностей РНК ми звели до задачі про обчислення вільної енергії комплексу двох взаємодіючих неоднорідних (гетерополимерных) ланцюгів, кожна з яких може утворювати кактусоподобную структуру. Ми показали, що з формально-математичної точки зору відомий рекурсивний алгоритм вирівнювання послідовностей ДНК – так званий, метод динамічного програмування Сміта-Ватермана – може розглядатися як межа нульової температури статистичної моделі зв’язування двох полімерних ланцюжків з довільною первинною структурою. Узагальнити це спостереження на випадок молекул РНК було вже справою техніки”, – розповідає керівник роботи, доктор фіз.-мат.наук Сергій Нечаєв.

При порівнянні молекул РНК, крім безпосередньої енергії зв’язку контактів, необхідно враховувати ентропію освіти різних вторинних структур. Таким чином, пошук максимальної загальної підпослідовності зводиться до обчислення мінімальної вільної енергії комплексу двох молекул: чим менше його значення, тим більше схожі дві порівнювані молекули РНК. Розроблений статистичний алгоритм можна використовувати і для вирішення зворотного завдання – відновлення оптимальної структури кожної із взаємодіючих молекул РНК по відомій послідовності нуклеотидів конкретної молекули РНК.

“Уявіть собі, – пояснює Нечаєв, – що в експерименті виникла необхідність передбачити вторинну структуру синтезованої молекули РНК послідовності нуклеотидів. Наш алгоритм дозволяє передбачити оптимальну з погляду статистичної фізики вторинну структуру молекули РНК, яка буде відповідати мінімуму вільної енергії. При цьому ми намагалися по можливості залишатися в рамках статистичної фізики і уникати евристичних міркувань, отриманих лише на основі аналізу експериментальних даних”.

Наслідком розробленого підходу стало досить несподіване спостереження. Виявилося, що якщо не обмежуватися лише чотирма типами нуклеотидів (аденін, цитозин, гуанін і урацил), присутніми у найпростішій моделі РНК з випадковою первинною структурою, а розглянути “алфавіт” з довільним числом “букв”, з “вирівнювання” молекул РНК при с ≤ 4 і при з > 4 відбувається по-різному.

“Алфавіт, який використовує природа, – говорить Сергій Нечаєв, – виділений тим, що при числі букв, що менше або дорівнює чотирьом, укладання дуже довгої молекули РНК практично не містить пропусків, тобто їх частка прагне до нуля, і кожного нуклеотиду знайдеться компліментарний. У разі ж, коли число букв більше чотирьох, в дуже довгому ланцюгу РНК завжди присутня велика кількість перепусток (їх число можна порівняти з довжиною всього ланцюжка). Число “чотири” є прикордонним: це максимальне число символів, при якому дуже довга випадкова РНК може утворювати “досконалу” вторинну структуру, тобто у кожного нуклеотиду в послідовності знайдеться компліментарний”.

Питання про те, чому природа використовує саме 4 типи нуклеотидів, – один з найважливіших в біології і генної інженерії. Як припускають дослідники з ФІАН, МДУ і МФТІ, з погляду статистичної фізики випадкових гетерополимеров зі складною ієрархічною вторинної структурою типу РНК, число “чотири” (аденозин, цитидин, гуанозин і уридин) є статистично виділеним серед усіх можливих алфавітів при вивченні проблеми вирівнювання. Для “лінійної” молекули ДНК, де кількість нуклеотидів також дорівнює чотирьом (аденозин, цитидин, гуанозин і тимидин), воно вже нічим не виділено. Це спостереження може розглядатися як непрямий аргумент на користь гіпотези “РНК-світу”, згідно якої на початковому етапі виникнення життя на Землі існували тільки РНК, а ДНК з’явилися вже в результаті їх еволюції.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *