Эволюция доменной архитектуры
Домены как единицы непрерывной эволюции белков Под непрерывной эволюцией будем понимать эволюцию последовательности, происходящую в силу незначительных изменений аминокислотной последовательности от поколения к поколению (и последующего отбора) Домены эволюционируют в составе белков, в том числе, однодоменных. Молекулярная филогения позволяет (до некоторой степени) восстановить непрерывную эволюцию домена.
Гомеобелки (подсемейство с OAR доменом) Пример из второго семестра
Непрерывность тоже не абсолютна! Вставка 20 остатков у гомеодоменов Циклическая перестановка у эндонуклеаз рестрикции (курсовая Нади Тухтубаевой) Перестановка мотивов ДНК-метилтрансфераз (см. диплом Ани Попенко)
Топология ДНК-метилтрансферазных доменов 5 Рис. 9 Схематичное описание топологии ДНК-метилтрансфераз разных классов. а) m6a_alpha_II (PDB:1q0s) б) m6a_gamma_I (PDB:2ar0) в) m5c_C5_II(PDB:1dct) г) m4c_beta_II (PDB:1boo) Все 10 структурных мотивы консервативны, но только мотивы X, I, IV и VIII оказались консервативны по последовательности в больших выборках.
Общность структуры 6 Рис. 10 Выравнивание бета- тяжей ДНК- метилтрансферазных доменов. И в третичной структуре бета-тяжи прекрасно накладываются. Рис. 11 Наложение бета тяжей ДНК- метилтрансферазных доменов групп альфа, бета и гамма. Синий домен – гамма (2ar0), красный – бета (1boo), зеленый – альфа (1q0s).
В эволюции доменов происходят редкие события дупликации гена, следовательно, белка потеря гена, следовательно, белка события или мутации, приводящие к изменению доменного состава белка рекомбинация ДНК мутации стоп-кодона мутации сайтов сплайсинга др.
Возможные сценарии эволюции доменной архитектуры с данным доменом 1. Усложнение: однодоменный белок предка (LUCA) на каком- то этапе соединился с другим белком, создав новую доменную архитектуру. Получив преимущества, новый белок либо сохранился у потомков, либо потерялся (любовь до гроба) 2. Редукция: домен предка (LUCA) уже входил в многодоменный белок. На каком-то этапе эволюции домены белка развелись, и домен стал существовать в белке с урезанной доменной архитектурой, например, в однодоменном белке (развод) 3. Непостоянство: в эволюции от предка домен претерпел множество соединений и разводов. Соединения и разводы не являются настолько существенными изобретениями эволюции, чтобы отбор их сохранял у всех потомков.
В эволюции гомеодомены включались в разные архитектуры Об этом можно судить по 216 различным доменным архитектурам гомеобелков, представленным в банке Pfam Гомеодомен Парный домен и гомеодомен Lim домены и гомеодомен Гомеодомен, продолженный лейциновой молнией POU домен и гомеодомен Два гомеодомена PBX-домен и гомеодомен
Какие архитектуры сохраняются, раз возникнув, а какие – случайны? В основе первых двух сценариев лежит предположение о том, что домен находит оптимальную архитектуру и далее живет в ней (постоянство) В 2011s семестре студенты примеры постоянства двухдоменной архитектуры, возникшей у LUCA Подтверждением служит дерево домена, включающее представителей из разных царств и с двумя разными архитектурами. Примеры: Золотарева Альмухаметов
Как восстановить сценарий Сценарий 1. На дереве домена сложная архитектура встречается в одной кладе. Менее сложная архитектура (например, однодоменная) встречается в более широком таксоне. Сценарий 2. На дереве домена архитектура (например, однодоменная) встречается в одной кладе. В то же время более сложная архитектура встречается в более широком таксоне. Сценарий 3. На дереве домена архитектуры не образуют монофилетических групп высокого уровня.
Примеры перетасовки доменов (domain shuffling) 25 белков 9 белков 2 белка 12 белков 223 белка 243 белка 507 белков
Эволюционные домены часто, но не всегда совпадают со структурными доменами.
Домены часто, но не всегда, имеют одинаковую функцию. Например: – HTH_5 - ДНК- связывающий домен ряда транскрипционных факторов – TrpA – цепочка А триптофансинтазы – Homeobox, он же гомеодомен, – ДНК- связывающий домен множества эукариотических транскрипционных факторов
Pfam Большая коллекция семейств доменов Для каждого семейства есть множественное выравнивание и профиль-HMM. Состоит из 2-х частей: PfamA – курируемая часть, покрывает 76% UniProt PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов, не вошедших в PfamA (раньше – ProDom, теперь – ADDA). Удобна для анализа доменной структуры белков.
Язык Pfam : Семейство – коллекция гомологичных белков. Домен – структурная единица, которую можно найти во множественном выравнивании. Повтор – короткая единица, нестабильная сама по себе, но образует стабильные структуры, если есть много копий. Мотив – короткая единица структуры вне глобулярных доменов. Клан – группа родственных записей.
Какая информация закодирована в картинке доменов белка Прямоугольники с закругленными краями – найден домен целиком. Край прямоугольника зубчатый – найден только фрагмент домена, за зубчиками домен не продолжается, хотя должен был бы быть. Прямоугольник с острыми краями – мотив, трансмебранный участок, участок малой сложности (например, десять остатков A) и т.п. – не является эволюционным доменом! Цветная полоска – домен из PfamB, т.е. найденные программой, автоматически выровненные, но не проанализированные экспертом, сходные по последовательности фрагменты разных белков. Домен, имеющий ID вида DUF… с номером - Domain of Unknown Function
Пример