Филогенетика: реконструкция эволюционного сценария.

Презентация:



Advertisements
Похожие презентации
Парсимония Прикладная генетика для зоологов, лекция 6 Мюге Н. С.
Advertisements

Primate molecular divergence dates. Steiper ME and Young NM Molecular Phylogenetics and Evolution 41, , 2006.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Филогенетические деревья. 1) Алфавит без пробелов5 2) Кол-во выравниваний10 3) Глобальное выравнивание10 4) Локальное выравнивание7 5) Афинные гэпы8 6)
Анализ данных Кластеризация. План лекции Иерархические алгоритмы (пример: алгоритм ближайшего соседа) Итеративные алгоритмы (пример: k-means) Плотностные.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Что такое K a, K n, K s, d N, d S ? Екатерина Ермакова Алматы, апрель 2006.
Primate molecular divergence dates. Steiper ME and Young NM Molecular Phylogenetics and Evolution 41, , 2006.
Лекция 3. Генеалогические деревья и коалесценция Альбрехт Дюрер Адам и Ева.
BLOSUM62 Matrix Модели эволюции нуклеотидных и аминокислотных последовательностей. AGA GGA AAA AAG AAA AGA AAA.
Филогенетические деревья (продолжение) Филогенетические деревья и таксономия организмов Сравнение деревьев Реконструкция филогении (общая схема) Расстояния.
Анализ данных Кластеризация. План лекции Модельные алгоритмы (пример: EM) Концептуальные алгоритмы (пример: COBWEB) Цель: Знакомство с основными алгоритмами.
Филогенетические деревья Что это такое Общий план действий Программы, которые строят деревья The time will come, I believe, though I shall not live to.
Филогенетические деревья «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и.
PBI Определение абзацев в тексте Сильвестров Алексей 9 ноября 2010 г.
Некоторые задачи планирования сети магистрального оператора Бутурлин И.А. Российский Университет Дружбы Народов.
Множественное выравнивание С.А.Спирин, весна 2009.
Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий.
Транксрипт:

Филогенетика: реконструкция эволюционного сценария

*** Эволюция существует Есть много методов реконструкции хода эволюции по последовательностям генов (белков) Они работают!

Жизнь очень разннобразна Эволюционная биология: современное разнообразие жизни продукт эволюционного процесса

Есть два утверждения эволюционной биологии: Слабое: Если взять современный вид и посмотреть на его предков, то чем они древнее, тем менее будут на него похожи Сильное: Если взять любые современные виды и отследить их историю в прошлом, то в какой-то отдаленный момент они сольются

Слабоое - Анагенез: эволюция вида Сильное - Кладогенез: расхождение видов

Свидетельства эволюции: Субоптимальность Гомология Иерархическое распредление признаков ^^^ ожидаемо увидеть, если есть медленная, жадная эволюция

Мы видим больше гомологии, чем оптимальности

Thompson. On growth and form, 1961

Признаки распределены иерархически Позвоночные: «внутри» живородящих находятся плацентарные Насекомые: «внутри» крылатых есть претерпевающие полный метаморфоз

Основные предположения филогенетического анализа С чем все согласны - – Гены (белки) эволюционируют со временем Что вызывает сомнения все остальное – Как они эволюционируют – Скорость эволюции – Как измерять эволюционное расстояние – Как строить филогенетические деревья

Замена нуклеотидов – частое дело в эволюции Mouse ACCAAAAAAA CATCCAAACA CCAACCCCAG CCCTTACGCA ATAGCCATAC AAAGAATATT Bovine ACCAAACCTG TCCCCACCAT CTAACACCAA CCCACATATA CAAGCTAAAC CAAAAATACC Lemur ACCAAACTAA CATCTAACAA CTACCTCCAA CTCTAAAAAA GCACTCTTAC CAAACCCATC Tarsier ATCTACCTTA TCTCCCCCAA TCAATACCAA CCTAAAAACT CTACAATTAA AAACCCCACC Squir M ACCCCAGCAA CTCGTTGTGA CCAACATCAA TCCAAAATTA GCAAACGTAC CAACAATCTC Jpn Mac ACTCCACCTG CTCACCTCAT CCACTACTAC TCCTCAAGCA ATACATAAAC TAAAAACTTC Rhesus M ACTTCACCCG TTCACCTCAT CCACTACTAC TCCTCAAGCG ATACATAAAT CAAAAACTTC Crab-E.M ACCCCACCTA CCCGCCTCGT CCGCTACTGC TTCTCAAACA ATATATAGAC CAACAACTTC BarbMacaq ACCCTATCTA TCTACCTCAC CCGCCACCAC CCCCCAAACA ACACACAAAC CAACAACTTT Gibbon ACTATACCCA CCCAACTCGA CCTACACCAA TCCCCACATA GCACACAGAC CAACAACCTC Orang ACCCCACCCG TCTACACCAG CCAACACCAA CCCCCACCTA CTATACCAAC CAATAACCTC Gorilla ACCCCATTTA TCCATAAAAA CCAACACCAA CCCCCATCTA ACACACAAAC TAATGACCCC Chimp ACCCCATCCA CCCATACAAA CCAACATTAC CCTCCATCCA ATATACAAAC TAACAACCTC Human ACCCCACTCA CCCATACAAA CCAACACCAC TCTCCACCTA ATATACAAAT TAATAACCTC

T C A G a a a a aa Jukes Cantor T C A G a f e b c d General T C A G Kimura Замены Существует много модель нуклеотидных замен

Задачиа филогенетики: построить разрешенное дерево видов

Три этапа построения филогенетических деревьев: 1) делаем множественное выравнивание гомологических последовательностей 2) строим на основе этого дерево 3) оцениваем ее достоверность

Множественное выравнивание – фундамент филоген. дерева Mouse ACCAAAAAAA CATCCAAACA CCAACCCCAG CCCTTACGCA ATAGCCATAC AAAGAATATT Bovine ACCAAACCTG TCCCCACCAT CTAACACCAA CCCACATATA CAAGCTAAAC CAAAAATACC Lemur ACCAAACTAA CATCTAACAA CTACCTCCAA CTCTAAAAAA GCACTCTTAC CAAACCCATC Tarsier ATCTACCTTA TCTCCCCCAA TCAATACCAA CCTAAAAACT CTACAATTAA AAACCCCACC Squir M ACCCCAGCAA CTCGTTGTGA CCAACATCAA TCCAAAATTA GCAAACGTAC CAACAATCTC Jpn Mac ACTCCACCTG CTCACCTCAT CCACTACTAC TCCTCAAGCA ATACATAAAC TAAAAACTTC Rhesus M ACTTCACCCG TTCACCTCAT CCACTACTAC TCCTCAAGCG ATACATAAAT CAAAAACTTC Crab-E.M ACCCCACCTA CCCGCCTCGT CCGCTACTGC TTCTCAAACA ATATATAGAC CAACAACTTC BarbMacaq ACCCTATCTA TCTACCTCAC CCGCCACCAC CCCCCAAACA ACACACAAAC CAACAACTTT Gibbon ACTATACCCA CCCAACTCGA CCTACACCAA TCCCCACATA GCACACAGAC CAACAACCTC Orang ACCCCACCCG TCTACACCAG CCAACACCAA CCCCCACCTA CTATACCAAC CAATAACCTC Gorilla ACCCCATTTA TCCATAAAAA CCAACACCAA CCCCCATCTA ACACACAAAC TAATGACCCC Chimp ACCCCATCCA CCCATACAAA CCAACATTAC CCTCCATCCA ATATACAAAC TAACAACCTC Human ACCCCACTCA CCCATACAAA CCAACACCAC TCTCCACCTA ATATACAAAT TAATAACCTC

Алгоритмы построения деревьев используют расстояния либо последовательности Character-based – Необходимо множественное выравнивание гомологичных последовательностей (ДНК или белков) Distance-based – Необходима матрица попарных расстояний между видами d ij, посчитанная на основе попарных сравнений последовательностей или других признаков (размеры клюва, пропорции костей и тд)

Методы филоген. реконструкции Character-based: Maximum likelihood Maximum parsimony Bayesian inference Distance-based: Neighbor-joining

Методы филоген. реконструкции Distance-based: Neighbor-joining

Neighbor-joining: простой, быстрый, неточный Distance based Идея минимальной эволюции Вычислительно достаточно быстр (~r 3 ), можно работать с большим количеством видов Менее точен, чем character-based методы

Neighbor-joining – циклический процесс Начинаем с топологии «звезда» (A) Цикл: –находим узлы, расстояние между которыми минимально –объединяем их создавая новый узел (u) –обновляем матрицу расстояний

Neighbor-joining – обновляем расстояния по формулам: Для новосозданного узла и дочерних: Для новосозданного узла и внешних:

Методы филоген. реконструкции Character-based: Maximum likelihood Maximum parsimony Bayesian inference

Character-based: методы оценки деревьев Принцип максимальной парсимонии (maximum parsymony) –Наиболее вероятный эволюционный сценарий тот, который содержит минимальное число изменений (эволюционных событий) (жадная эволюция) Принцип максимального правдоподобия (maximum likelihood) –По данному дереву определяет вероятность наблюдаемых сиквенсов; выбираем дерево для которого такая вероятность максимальна

Правдоподобие нужно, когда нельзя оценить вероятность Если известно число граний, легко найти вероятность выпадений данной последовательности А если есть последовательность выпадений, но мы не знаем сколько граней? – Делаем предположения о кости и оцениваем вероятность выпадений – это и есть правдопобие

Максимальное правдоподобие – перебор деревьев Перебираем ряд деревьев, вычисляем для них правдоподобие Выбираем дерево, которое дает максимум вероятности наблюдаемых данных

Как вычислить правдоподобие дерева

Есть старая, хорошая, бесплатная программа PAML (Phylogenetic Analysis by Maximum Likelihood) На вход множественное выравнивание На выходе - дерево Метод уже хорошо реализован

Bootstrap – определить достоверность ветвей и дерева целиком

100 – 1000 выборок

Bootstrap анализ - оцениваем достоверность ветвей > 70 – неплохо > 90 – надежно

Филогенетика работает

1) Кондрашов Алексей Симонович Курс лекций "Введение в эволюционную биологию " 2) The Logic of Chance: The Nature and Origin of Biological Evolution. Eugene V. Koonin Если вам это интересно: