Выравнивание последовательностей
Примеры РНК-зависимые РНК полимеразы пикорнавирусов Два фрагмента ДНК бруцеллы
Буквы ставят в одну колонку потому, что они чем-то объединены Некодирующая ДНК: нуклеотиды в одной колонке произошли от одного и того же нуклеотида предковой последовательности Говорят, что последовательности гомологичны, если у них был общий предок. Гомологичность последовательностей можно предположить по их сходству
Белки: совмещение структур и выравнивание последовательностей
Ещё причины сопоставлять буквы Белок: аминокислотные остатки в одной колонке если: при совмещении структур белков C атомы хорошо совмещаются; боковые цепи выполняют сходную функцию РНК: если нуклеотиды из одной колонки участвуют в одном и том же элементе вторичной структуры РНК – спирали, петле и др. Функциональная некодирующая ДНК – промоторы, регуляторные участки и т.п.: нуклеотиды из одной колонки играют сходную роль (в этом случае гомологии может и не быть!)
Пространственное совмещение полипептидных цепей белков MTA1_YEAST и MAT2_YEAST На плоской картинке видно плохо
Выравнивание последовательностей Название последовательности Номер столбца выравнивания Номер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ Консервативный остаток Функционально консервативная позиция
Пример: выравнивание POU- белков. Домены.
Продолжение Биологически осмысленное выравнивание может быть в одной части выданного программой выравнивания и не быть – в другой!
Как программы выравнивают две последовательности? Матрица весов замен Штраф за открытие гэпа Штраф за продолжение гэпа Вес выравнивания Оптимальное выравнивание Программа успешно выровняет любые две последовательности!
ПРИМЕР gap open -6 gap extension -2 ARNDCQEGHI… A R N D C Q E G H I …
ARNDCQEGHILKMFPSTWYVBZX* A R N D C Q E G H I L K M F P S T W Y V B Z X * 1 Матрица BLOSUM62
Парное выравнивание Локальное (алгоритм Smith – Waterman) – находит наиболее сходные участки двух последовательностей. Глобальное (Needleman – Wunsch) – по всей длине последовательностей: пригодно только для последовательностей, похожих по всей длине! Карта локального сходства
Карта локального сходства для наглядной оценки сходства последовательностей
Карта локального сходства для наглядной оценки сходства последовательностей
Множественное выравнивание Как правило, глобальное; программы Muscle MAFFT ClustalW T-coffee …. Локальное – находит лучшие т.н. мотивы MEME ….
Множественное выравнивание Программа JalView позволяет визуализировать выравнивание. Она же может послать ваши последовательности на один из серверов, делающих выравнивания.
Pfam –одна из популярных БД семейств доменов белков и их выравниваний
Реконструкция филогении по последовательностям
Путь эволюции cyb5_humancyb5_chick или t cyb5_humancyb5_chick
Филогенетическое дерево HumanChickenMouse Human Mouse Chicken
Когда хотят отразить разное число мутаций, произошедших на пути от общего предка, получается что-то вроде такого. Human Chicken Mouse Human Mouse Chicken «Молекулярные часы»: всегда идут, но иногда неточно
Описание структуры дерева (терминология) Узел (node) точка разделения предковой последовательности (вида, популяции) на две независимо эволюционирующие. Соответствует внутренней вершине графа, изображающего эволюцию. Лист (leaf) реальный (современный) объект; внешняя вершина графа. Ветвь (branch) связь между узлами или между узлом и листом; ребро графа. Корень (root) гипотетический общий предок. Кла́да группа организмов, которые являются потомками единственного общего предка и всех потомков этого предка. Корень Клада Лист Ветвь Узел
Небинарное дерево HumanChickenMouse Human Mouse Chicken Dog
Неукоренённое дерево Human Mouse Dog Cat Rat Monkey
Может быть укоренено многими способами
Скобочная формула Newick Standard: ((((VICFA:3, BRANA:3):3, MARPO:6):2, PROWI:8):7, ((MOUSE:3, HUMAN:3):3, CAEEL:6):9); «The reason for the name is that the second and final session of the committee met at Newick's restaurant in Dover, and we enjoyed the meal of lobsters.» Joseph Felsenstein,
Топология дерева =
Схема алгоримов построения деревьев Выравнивание Матрица расстояний между последовательностями Дерево символьно- ориентированные методы Neighbor-Joining, Fitch, FastME
Эволюция видов и эволюция белков Когда виды разделяются, то разделяются пути эволюции всех их белков… В результате большинству белков одного вида соответствует ортолог в другом виде. Но: 1)Бывают дупликации белков без разделения видов : два родственных белка существуют в одном геноме и эволюционируют (почти) независимо – такие белки называются паралогами. 2)Бывают потери генов. Если в двух видах потерялись по одному белку из пары паралогов, то может получиться, что общий предок белков, которые выглядят как ортологи, «жил» существенно раньше, чем общий предок видов. 3)Бывает, что два белка объединяются в один многодоменный, и наоборот. Поэтому правильнее говорить об эволюции белковых доменов.
Программы реконструкции деревьев Много алгоритмов реализовано в пакете PHYLIP. Его можно скачать: и установить на своём компьютере. Есть веб-интерфейс на сайте Института Пастера (Франция): Для «непрофессионалов» достаточно JalView для построения деревьев и программы MEGA для их изображения./
КОНЕЦ