Филогенетика: реконструкция эволюционного сценария
*** Эволюция существует Есть много методов реконструкции хода эволюции по последовательностям генов (белков) Они работают!
Жизнь очень разннобразна Эволюционная биология: современное разнообразие жизни продукт эволюционного процесса
Есть два утверждения эволюционной биологии: Слабое: Если взять современный вид и посмотреть на его предков, то чем они древнее, тем менее будут на него похожи Сильное: Если взять любые современные виды и отследить их историю в прошлом, то в какой-то отдаленный момент они сольются
Слабоое - Анагенез: эволюция вида Сильное - Кладогенез: расхождение видов
Свидетельства эволюции: Субоптимальность Гомология Иерархическое распредление признаков ^^^ ожидаемо увидеть, если есть медленная, жадная эволюция
Мы видим больше гомологии, чем оптимальности
Thompson. On growth and form, 1961
Признаки распределены иерархически Позвоночные: «внутри» живородящих находятся плацентарные Насекомые: «внутри» крылатых есть претерпевающие полный метаморфоз
Основные предположения филогенетического анализа С чем все согласны - – Гены (белки) эволюционируют со временем Что вызывает сомнения все остальное – Как они эволюционируют – Скорость эволюции – Как измерять эволюционное расстояние – Как строить филогенетические деревья
Замена нуклеотидов – частое дело в эволюции Mouse ACCAAAAAAA CATCCAAACA CCAACCCCAG CCCTTACGCA ATAGCCATAC AAAGAATATT Bovine ACCAAACCTG TCCCCACCAT CTAACACCAA CCCACATATA CAAGCTAAAC CAAAAATACC Lemur ACCAAACTAA CATCTAACAA CTACCTCCAA CTCTAAAAAA GCACTCTTAC CAAACCCATC Tarsier ATCTACCTTA TCTCCCCCAA TCAATACCAA CCTAAAAACT CTACAATTAA AAACCCCACC Squir M ACCCCAGCAA CTCGTTGTGA CCAACATCAA TCCAAAATTA GCAAACGTAC CAACAATCTC Jpn Mac ACTCCACCTG CTCACCTCAT CCACTACTAC TCCTCAAGCA ATACATAAAC TAAAAACTTC Rhesus M ACTTCACCCG TTCACCTCAT CCACTACTAC TCCTCAAGCG ATACATAAAT CAAAAACTTC Crab-E.M ACCCCACCTA CCCGCCTCGT CCGCTACTGC TTCTCAAACA ATATATAGAC CAACAACTTC BarbMacaq ACCCTATCTA TCTACCTCAC CCGCCACCAC CCCCCAAACA ACACACAAAC CAACAACTTT Gibbon ACTATACCCA CCCAACTCGA CCTACACCAA TCCCCACATA GCACACAGAC CAACAACCTC Orang ACCCCACCCG TCTACACCAG CCAACACCAA CCCCCACCTA CTATACCAAC CAATAACCTC Gorilla ACCCCATTTA TCCATAAAAA CCAACACCAA CCCCCATCTA ACACACAAAC TAATGACCCC Chimp ACCCCATCCA CCCATACAAA CCAACATTAC CCTCCATCCA ATATACAAAC TAACAACCTC Human ACCCCACTCA CCCATACAAA CCAACACCAC TCTCCACCTA ATATACAAAT TAATAACCTC
T C A G a a a a aa Jukes Cantor T C A G a f e b c d General T C A G Kimura Замены Существует много модель нуклеотидных замен
Задачиа филогенетики: построить разрешенное дерево видов
Три этапа построения филогенетических деревьев: 1) делаем множественное выравнивание гомологических последовательностей 2) строим на основе этого дерево 3) оцениваем ее достоверность
Множественное выравнивание – фундамент филоген. дерева Mouse ACCAAAAAAA CATCCAAACA CCAACCCCAG CCCTTACGCA ATAGCCATAC AAAGAATATT Bovine ACCAAACCTG TCCCCACCAT CTAACACCAA CCCACATATA CAAGCTAAAC CAAAAATACC Lemur ACCAAACTAA CATCTAACAA CTACCTCCAA CTCTAAAAAA GCACTCTTAC CAAACCCATC Tarsier ATCTACCTTA TCTCCCCCAA TCAATACCAA CCTAAAAACT CTACAATTAA AAACCCCACC Squir M ACCCCAGCAA CTCGTTGTGA CCAACATCAA TCCAAAATTA GCAAACGTAC CAACAATCTC Jpn Mac ACTCCACCTG CTCACCTCAT CCACTACTAC TCCTCAAGCA ATACATAAAC TAAAAACTTC Rhesus M ACTTCACCCG TTCACCTCAT CCACTACTAC TCCTCAAGCG ATACATAAAT CAAAAACTTC Crab-E.M ACCCCACCTA CCCGCCTCGT CCGCTACTGC TTCTCAAACA ATATATAGAC CAACAACTTC BarbMacaq ACCCTATCTA TCTACCTCAC CCGCCACCAC CCCCCAAACA ACACACAAAC CAACAACTTT Gibbon ACTATACCCA CCCAACTCGA CCTACACCAA TCCCCACATA GCACACAGAC CAACAACCTC Orang ACCCCACCCG TCTACACCAG CCAACACCAA CCCCCACCTA CTATACCAAC CAATAACCTC Gorilla ACCCCATTTA TCCATAAAAA CCAACACCAA CCCCCATCTA ACACACAAAC TAATGACCCC Chimp ACCCCATCCA CCCATACAAA CCAACATTAC CCTCCATCCA ATATACAAAC TAACAACCTC Human ACCCCACTCA CCCATACAAA CCAACACCAC TCTCCACCTA ATATACAAAT TAATAACCTC
Алгоритмы построения деревьев используют расстояния либо последовательности Character-based – Необходимо множественное выравнивание гомологичных последовательностей (ДНК или белков) Distance-based – Необходима матрица попарных расстояний между видами d ij, посчитанная на основе попарных сравнений последовательностей или других признаков (размеры клюва, пропорции костей и тд)
Методы филоген. реконструкции Character-based: Maximum likelihood Maximum parsimony Bayesian inference Distance-based: Neighbor-joining
Методы филоген. реконструкции Distance-based: Neighbor-joining
Neighbor-joining: простой, быстрый, неточный Distance based Идея минимальной эволюции Вычислительно достаточно быстр (~r 3 ), можно работать с большим количеством видов Менее точен, чем character-based методы
Neighbor-joining – циклический процесс Начинаем с топологии «звезда» (A) Цикл: –находим узлы, расстояние между которыми минимально –объединяем их создавая новый узел (u) –обновляем матрицу расстояний
Neighbor-joining – обновляем расстояния по формулам: Для новосозданного узла и дочерних: Для новосозданного узла и внешних:
Методы филоген. реконструкции Character-based: Maximum likelihood Maximum parsimony Bayesian inference
Character-based: методы оценки деревьев Принцип максимальной парсимонии (maximum parsymony) –Наиболее вероятный эволюционный сценарий тот, который содержит минимальное число изменений (эволюционных событий) (жадная эволюция) Принцип максимального правдоподобия (maximum likelihood) –По данному дереву определяет вероятность наблюдаемых сиквенсов; выбираем дерево для которого такая вероятность максимальна
Правдоподобие нужно, когда нельзя оценить вероятность Если известно число граний, легко найти вероятность выпадений данной последовательности А если есть последовательность выпадений, но мы не знаем сколько граней? – Делаем предположения о кости и оцениваем вероятность выпадений – это и есть правдопобие
Максимальное правдоподобие – перебор деревьев Перебираем ряд деревьев, вычисляем для них правдоподобие Выбираем дерево, которое дает максимум вероятности наблюдаемых данных
Как вычислить правдоподобие дерева
Есть старая, хорошая, бесплатная программа PAML (Phylogenetic Analysis by Maximum Likelihood) На вход множественное выравнивание На выходе - дерево Метод уже хорошо реализован
Bootstrap – определить достоверность ветвей и дерева целиком
100 – 1000 выборок
Bootstrap анализ - оцениваем достоверность ветвей > 70 – неплохо > 90 – надежно
Филогенетика работает
1) Кондрашов Алексей Симонович Курс лекций "Введение в эволюционную биологию " 2) The Logic of Chance: The Nature and Origin of Biological Evolution. Eugene V. Koonin Если вам это интересно: