Эволюция геномов М.Гельфанд «Сравнительная геномика» БиБи 4 курс, ШБ 2 год, ПФУ Весна 2013
Статус гена в геноме PPI – количесто белок- белковых взаимодействий EL – уровень экспрессии KE – летальность нокаутов ER – скорость эволюции PGL – вероятность потери в геноме NP – количество паралогов GI – количество геномных взимодействий
Гены и геномы - деревья Дерево генов может не совпадать с деревом видов –Дупликации –Делеции –Горизонтальные переносы
Задача согласования деревьев «вложение» дерева видов в дерево генов с минимальным числом дупликаций и делеций –(минимальное) количество дупликаций и делеций связано (чем раньше дупликации и чем их больше, тем больше делеций), так что можно минимизировать одновременно … и горизонтальных переносов –Проблема: как взвешивать события? Всегда можно обойтись минимальным числом дупликаций и очень многими делециями без переносов И наоборот – одними переносами
Альтернативные подходы к идентификации горизонтальных переносов Не тот ближайший родственник (митохондрии, термотога, аквифекс) Гены, которые слишком близко друг к другу (много ближе, чем полагается для данной пары геномов) –Ср. контроль ортологичности Упражнение: как будут выглядеть дерево и график, если геном Х известен и есть еще более далекий Z?
примеры По горизонтали – расстояние между геномами По вертикали – расстояние между генами
The fraction of horizontally transferred genes in Methanosarcina spp. decreases with time well, in some sense date of HGT: Methnosarcinal es, Methanosarcina ceae, Methanosarcina,
Геномные перестановки
Полногеномные дупликации
Дрожжи
Можно обойтись без пар
Влияние внутри- геномных перестановок после дупликации: хромосомная мозаика
Геномы и виды Хромосомная нестабильность –У человека и шимпанзе разное число хромосом –Слепушонки Симбиогенез –Митохондрии и хлоропласты. Нуклеоморф –Buchnera, Carsonella etc и т.п. Вольбахия; осы Цихлиды и трехиглые колюшки Плодовые мухи и наездники
Bacterial species Morphology of cells and colonies Catabolism (metabolic abilities) Anabolism (auxotrophy) Cell wall components 70% by DNA-DNA hybridization, 5ºC T m (Wayne et al., 1987) – 'gold standard'. 97% 16S rRNA sequence similarity (Stackebrandt and Goebel, 1994)
Gene complements (gene-ome) text
Pan-genomes Total set of genes in all strains of a species / genus (Tettelin et al,, 2005): –core ((universal genome): present in (almost) all strains –periphery: present in some strains –unique: (almost) strain-specific
Escherichia + Shigella. Gene occurrence in strains
Sum of three exponents (Wolf&Koonin) y = exp (–0.53x ) + exp (–0.02x ) + exp (0.60x – 12.27)
Sum of two power laws y = 4400·x – · (32–x) –1.26
Add Salmonella – get internal peaks Universal genome of Salmonella Universal genome of Escherichia
Core genome (still shrinks) EC+Shi filtered EC+Shi unfiltered EC+Shi+Sal unfiltered EC+Shi+Sal filtered
Pan-genome is not saturated EC+Shi+Sal unfiltered EC+Shi filtered EC+Shi unfiltered EC+Shi+Sal unfiltered
Pan-genome increase per added genome EC+Shi unfiltered EC+Shi filtered EC+Shi+Sal unfiltered EC+Shi+Sal filtered
Fractional pan-genome stabilizes sawtooth pattern due to rounding effects number of genomes number of genes fraction of genomes
Double pan-genome (Escherichia vs Salmonella):
Double pan-genome (Escherichia vs Shigella): No Escherichia- specific periphery
Double pan-genome (pathogen vs commensal Escherichia):
R.Lan, P.R.Reeves / Microbes and Infection 4 (2002)
44% ordered trees 74% ordered trees 88 % ordered trees Escherichia-Salmonella division in trees
Escherichia-Salmonella division in trees, groups w/o paralogs 55% ordered trees 81% ordered trees 92 % ordered trees
Виды и далее Нематоды, дрозофилы и млекопитающие (не)Монофилетические таксоны. Птицы как класс рептилий.