Cравнение биологических последовательностей На основе лекции А.Б.Рахманиновой, 2008
Biologists must constantly keep in mind that what they see was not designed, but rather evolved. It might be thought, therefore, that evolutionary arguments would play a large part in guiding biological research, but this is far from the case. Francis Crick What Mad Pursuit (1988) pp «Копирование с модификацией» центральная парадигма эволюции, в которой новые белки и/или новые биологические функции моделируются из имевшихся ранее.» (Д.Гасфильд, 2003)
Пути эволюции последовательностей
Мутации gatcaacactacttgacttcaagacttaccataaagaaaac gatcaacactacttgacttcaaaacttaccataaagaaaac точечная замена gatcaacactacttgacttcaagacttaccataaagaaaac gatcaacactacttgacttcaacttaccataaagaaaac делеция gatcaacactacttgacttcaagacttaccataaagaaaac gatcaacactacttgacttcaagatacttaccataaagaaaac инсерция (вставка)
Точечные мутации Молчащая мутация Замена аминокислотного остатка Терминация (обрыв цепи) Сдвиг рамки считывания
Эволюция белков Мутации в белках: возникают случайно могут закрепиться или исчезнуть конкретная мутация может быть: летальной вредной слабовредной нейтральной полезной Последние три типа порождают полиморфизм данного белка в популяции Доля каждого варианта подвержена случайным изменением (модель: «случайное блуждание с поглощением»). За исторически короткое время один из вариантов (старый или новый) исчезает. Во втором случае говорят, что мутация закрепилась.
История белка Приближённая картина: один белок – это конкретный белок в конкретный момент времени у конкретного вида живых организмов. Можно (теоретически) проследить историю данного белка во времени. С течением времени последовательность белка меняется. Это и называется эволюцией белка. При разделении вида на два все белки этих видов начинают эволюционировать независимо время белок Кроме того, нередко случается дупликация гена в геноме; после дупликации соответствующие белки также эволюционируют независимо
Последовательности двух белков >CYB5_CHICK P00174 Cytochrome b5 MVGSSEAGGEAWRGRYYRLEEVQKHNNSQSTWIIVHHRIYDITKFLDEHPGGEEVLREQA GGDATENFEDVGHSTDARALSETFIIGELHPDDRPKLQKPAETLITTVQSNSSSWSNWVI PAIAAIIVALMYRSYMSE >CYB5_HUMAN P00167 Cytochrome b5 MAEQSDEAVKYYTLEEIQKHNHSKSTWLILHHKVYDLTKFLEEHPGGEEVLREQAGGDAT ENFEDVGHSTDAREMSKTFIIGELHPDDRPKLNKPPETLITTIDSSSSWWTNWVIPAISA VAVALMYRLYMAED Если присмотреться, то видно, что последовательности имеют много общего
Выравнивание CYB5_CHICK 1 MVGSSEAGGEAWRGRYYRLEEVQKHNNSQSTWIIVHHRIYDITKFLDEHP 50.:|...||.:||.|||:||||:|:|||:|:||::||:||||:||| CYB5_HUMAN 1 ---MAEQSDEA--VKYYTLEEIQKHNHSKSTWLILHHKVYDLTKFLEEHP 45 CYB5_CHICK 51 GGEEVLREQAGGDATENFEDVGHSTDARALSETFIIGELHPDDRPKLQKP 100 ||||||||||||||||||||||||||||.:|:|||||||||||||||.|| CYB5_HUMAN 46 GGEEVLREQAGGDATENFEDVGHSTDAREMSKTFIIGELHPDDRPKLNKP 95 CYB5_CHICK 101 AETLITTVQSNSSSWSNWVIPAIAAIIVALMYRSYMSE- 138.||||||:.|:||.|:|||||||:|:.||||||.||:| CYB5_HUMAN 96 PETLITTIDSSSSWWTNWVIPAISAVAVALMYRLYMAED 134 Выравнивание имеется смысл сопоставления букв одной последовательности буквам другой. Против букв, которым ничего не соответствует в другой последовательности, ставят знак «гэпа» (пропуска, пробела); здесь это дефис. Между последовательностями или под ними могут стоять знаки, облегчающие визуальный анализ; здесь это |, : и точка.
# Matrix made by matblas from blosum62.iij # * column uses minimum score # BLOSUM Clustered Scoring Matrix in 1/2 Bit Units # Blocks Database = /data/blocks_5.0/blocks.dat # Cluster Percentage: >= 62 # Entropy = , Expected = A R N D C Q E G H I L K M F P S T W Y V B Z X * A R N D C Q E G H I L K M F P S T W Y V B Z X *
Что есть что (редактор GeneDoc) Название последовательности Номер столбца выравнивания Номер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ Консервативный остаток Функционально консервативная позиция
Выравнивание на основе сопоставления пространственных структур Этим Ca-атомам в «синей» структуре ничего не соответствует в «зелёной» Большая часть остатков двух цепей соответствуют друг другу. Соответствие в данном случае определяется хорошим наложением структур в пространстве.
Парные выравнивания Полные (global) Частичные (local) Полное выравнивание – таблица, обе строки которой представляют собой полные последовательности белков, перемежаемые в некоторых местах знаками пропусков. Строки частичного выравнивания представляют собой участки последовательностей двух белков, перемежаемые знаками пропусков. Prot 1: 131 QPGEVIQSYYPDQPKLASAFVRHALGIRGIVCIVERPGAVYTGDEIEV 178 P + I+ D F A G RG++ VERPG + G+ + + Prot 2: 138 FPAKEIEK---DHAGFGPKFKPAATGRRGVMAWVERPGVLKAGETLRL 182 Пример частичного выравнивания
Карта локального сходства