3. Сравнение пространственных структур белков. Выравнивание последовательностей гомеодоменов Пример 1: гомеодомены.

Презентация:



Advertisements
Похожие презентации
Выравнивание полипептидных цепей в пространстве С.А. Спирин 20 ноября 2012.
Advertisements

Выравнивание … … последовательностей белков и его биологический смысл.
Структурные классификации 2012 Классификации трехмерных структур 1.
Поворот (вращение) движение, при котором по крайней мере одна точка плоскости (пространства) остаётся неподвижной. В физике нередко поворотом называется.
Множественное выравнивание С.А.Спирин, весна 2009.
Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина.
1 Исследование алгоритмов решения задачи k коммивояжеров Научный руководитель, проф., д.т.н. Исполнитель, аспирант Ю.Л. Костюк М.С. Пожидаев Томский государственный.
5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г.5 ноября 2012 г. Лекция 6. Сравнение двух выборок 6-1. Гипотеза о равенстве средних. Парные выборки 6-2.Доверительный.
Последовательности белков Эволюционные домены и их выравнивание С.А.Спирин,
Что нужно знать: динамическое программирование – это способ решения сложных задач путем сведения их к более простым задачам того же типа динамическое.
Название последовательности Номер столбца выравнивания Номер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ Консервативный остаток Функционально.
МЕТОДЫ ОПТИМИЗАЦИИ § 1. Основные понятия. Под оптимизацией понимают процесс выбора наилучшего варианта из всех возможных В процессе решения задачи оптимизации.
Множественное выравнивание С.А.Спирин, весна 2011.
Множественное выравнивание С.А.Спирин, весна
Нелинейное программирование Практическое занятие 6.
Детерминированные игры с полной информацией. Выигрышная стратегия в игре.
ПРОГНОЗИРОВАНИЕ ДЕЯТЕЛЬНОСТИ ПРЕДПРИЯТИЯ Теоретические основы анализа результатов прогнозирования Лекция 7.
Теория графов Основные определения. Задание графов Графический способ – Привести пример графического задания графа, состоящего из вершин А, В и С, связанных.
Элементы векторной алгебры.. Определение Совокупность всех направленных отрезков, для которых введены операции: - сравнения - сложения - умножения на.
Лекция 4 Поляризация поперечной ЭМВ (векторные волны)
Транксрипт:

3. Сравнение пространственных структур белков

Выравнивание последовательностей гомеодоменов Пример 1: гомеодомены

Совмещение полипептидных цепей гомеодоменов

Какая программа выравнивания не выдала бы такой результат! В структурном выравнивании три остатка сдвинуты к левому краю разрыва

Выравнивание мотивов A, B, C РНК- зависимых РНК-полимераз вирусов Мотив A Консервативные остатки: 2 из 39 (5%!) Пример 2: РНК-зависимые РНК-полимеразы вирусов

Мотив B Функционально консервативные остатки: 4 из 37 (10%)

Мотив С Консервативные остатки: 3 из 22 (14%)

Совмещение в пространстве мотивов A, B, C из полимераз 9 разных вирусов Мотив A Мотив C Мотив B Здесь расположен активный центр полимеразы

Геометрическое ядро этого семейства полимераз состоит из 58 C атомов в каждой из 9-и структур Критерий сходства – расстояния между любыми соответственными C отличаются не более чем на 2 ангстрема

Геометрическое ядро семейства структур (Gerstein, 1995; I.Gelfand&Kister, 1998) Совокупность участков полипептидной цепи родственных белков (или комплексов макромолекул), с высокой точностью одинаково расположенных во всех представителях семейства структур Англ.: geometrical core, structure core

Сходство всех этих полимераз продолжается на большую часть глобулы, хотя и без совпадения остовов цепей в пространстве Fingers Palm Thumb Template RNA Product RNA NTP Дополнительные фрагменты цепи некоторых полимераз не показаны

Метод сравнения формы белков, структуры которых удалось совместить RASMOL: Select *B and not within(5.0, *A) Save selected file_B # Select *A and not within(5.0, *B) Save selected file_A Потом (1) Найти какие остатки цепи A (соотв. B) дополнительные (2) Охарактеризовать объемы дополнительных частей (например, в числе атомов)

В родстве со всем, что есть, уверясь И знаясь с будущим в быту, Нельзя не впасть к концу, как в ересь, В неслыханную простоту. Но мы пощажены не будем, Когда ее не утаим. Она всего нужнее людям, Но сложное понятней им. Б. Пастернак

Фрагмент выравнивания (по Xu et al., 2003) Функционально консервативные остатки: 13 из 150 (8%)

Продолжение Функционально консервативные остатки: 5 из 140 (4%)

Выводы Консервативные по последовательности участки полипептидной цепи сохраняют взаимное расположение в структурах белков Даже слабая, но правильная, консервативность свидетельствует в пользу сходства структур

Пространственная структура остова полипептидной цепи консервативнее последовательности! Почему в эволюции с точностью в 1-2 ангстрема поддерживается пространственное расположение остова полипептидной цепи при том, что аминокислотные остатки в тех же самых участках заменяются???

Токарный станок – это фермент, катализирующий реакцию превращения заготовки в деталь, имеющую цилиндрическую, коническую или любую форму тела вращения 3 м 3 см

Станина остается неизменной!

Рост числа расшифрованных структур белков (PDB)

Сравнение 3D структур необходимо для - моделирования, - предсказания функции, - изучения эволюции белков Главный ( и почти единственный широко распространенный ) метод сравнения структур – выравнивание полипептидных цепей в пространстве

Постановки задачи пространственного выравнивания Алгоритмы

Пространственное выравнивание структур белков по C α атомам: белки рассматриваются кактвердое тело

1. Парное выравнивание: Даны две структуры. Найти их наилучшее пространственной выравнивание 2. Поиск в БД: Дана структура. В банке данных (например, PDB) найти все похожие. 3. Множественное выравнивание: Даны n структур родственных (или не очень) белков (доменов). Найти наилучшее пространственное выравнивание всех вместе

В задачах пространственного выравнивания есть варианты постановки A.При заданном (частичном!) выравнивании последовательностей. B.Без заданного выравнивания последовательностей

Задача 1A (парное выравнивание) Дано: –n точек в пространстве A 1, …, A n - центры C атомов из выровненных остатков 1-й структуры –n точек в пространстве B 1, …, B n - центры C атомов из выровненных остатков 2-й структуры A1A1 A2A2 A3A3 A4A4 A5A5 B1B1 B3B3 B1B1 B4B4 B5B5 B2B2 Структура A Структура B

Найти: Наилучшее относительно некоторого параметра (A,B) совмещение Минимальное значение min (A,B) A1A1 A2A2 A3A3 A4A4 A5A5 B1B1 B3B3 B4B4 B5B5 B2B2

Параметр сходства (A,B) Среднее квадратичное расстояние: – Обе структуры помещены в одно пространство (можно воображать, что в один PDB файл) – (A,B)=sqrt(Σ i расст.(A i,B i ) 2 ) Английская аббревиатура: rmsd – root mean square deviation –Чем меньше (A,B), тем лучше структуры совмещены в пространстве

Другие меры сходства Максимальное расстояние: –Обе структуры поме щены в одно пространство (A,B)=max(расст.(A i,B i ))

Пара точек Расстоян ие между ними A 1,B A 2,B A 3,B A 4,B A 5,B A 6,B A 7,B A 8,B A 9,B A 10,B Сравнение двух мер сходства

Выравнивание без совмещения: сравнение матриц расстояний между C α атомами Матрица расстояний между C α атомами в структуре A A Полипептидная цепь

Если две матрицы расстояний совпадают, то соответствующие им конфигурации атомов могут быть совмещены движением пространства ( сохраняющим или не сохраняющим ориентацию) Если элементы двух матриц различаются не на много, то конфигурации хорошо совмещаются в пространстве

Задача 1A для rmsd эффективно решается итеративными процедурами (функция Fit by selection в SwissPDBviewer'е) Sippl&Stegbuchner, 1991: (1) Переместить центры тяжести и A, и B в начало координат (2) Подобрать поворот B вокруг оси X, минимизирующий (A,B) (угол вращения φ n вычисляется - выводится формула) (3) -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- Y -- '' -- ψ n (4) -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- Z -- '' -- ω n (5) Если φ n, ψ n, ω n < заданного порога δ, то остановка; иначе повторить (2) – (4)

1B. Пространственное выравнивание 2х структур без заданного выравнивания последовательностей Для данного порога d найти подмножество A={A 1, …, A n } C α атомов первой структуры и подмножество B={B 1, …, B n } C α атомов такие, что (A,B)< d ( какая-либо из мер сходства) (2) A 1, …, A n соблюдают порядок вдоль полипептидной цепи, возможно, с разрывами любой длины (3) B 1, …, B n соблюдают порядок вдоль полипептидной цепи, возможно, с разрывами любой длины (4) число n выбранных атомов максимально возможное

Не существует эффективных алгоритмов, гарантирующих точное решение задачи. Задача вычислительно сложная! Все предложенные эффективные алгоритмы основаны на эвристиках. В простых случаях дают правильный ответ, в более сложных – могут ошибаться.

Несколько работоспособных сервисов DALI server (алгоритм DALI, Holm, Sander, 1993) MultiProt –( алгоритм MUSTA, Leibowits, Nussinov, Wolfson, 2001) VAST (NCBI) MSD CE (Shindyanov&Bourne, 1998) SARF (Spatial ARangement of backbone Fragments, Alexandrov, 1996)

Алгоритм DALI (L.Holm&C.Sander) 1.Мера сходства двух сопоставленных наборов атомов A=(A 1, …, A n ) и B=(B 1, …, B n ): 1)Обозначения: d A i,j - расстояние между атомами A i и A j из структуры A d B i,j - расстояние между атомами B i и B j из структуры B

2)Модуль разности | d A i,j - d B i,j | определяет вес сходства для данной пары пар атомов: i,j = F(| d A i,j - d B i,j |) где F(x) – функция, определенная ниже 3)Чего хотим от i,j : 1.Чем больше i,j, тем более похожи структуры (по аналогии с весом – score – выравнивания последовательностей) 2.Разность расстояний измеряется в процентах, а не в абсолютных величинах 3.Значимость различий быстро убывает с расстоянием

(i,j) = | d A ij – d B ij | E d * ij w(d * ij ) E - 4) Реализация – elastic similarity score: E =0.2 ( по умолчанию) w(r) = exp(-r 2 / 2 ) где d * ij = среднее арифметическое d A ij и d B ij

2.Алгоритм. Шаг 1 – отбор сходных пар гексапептидов – начальных данных для пространственного выравнивания Пара гексапептидов (A,A) в структуре A и сходная пара гексапептидов (B,B) в структуре B B A i i+1 i+2 i+3i+4 i+5 j j+2 j+1 j+5 j+4 j+3 i i+1 i+4 i+5 j j+2 j+1 j+5 j+4 j+3 i+2 i+3 A B Структура AСтруктура B

XXXXXX XXXXXX 30+++XXXXXX 40++XXXXXX 50+XXXXXX 60XXXXXX Матрица для пары гексапептидов извлекается из полной матрицы расстояний

1)Перебор гексапептидов в каждой структуре: 1.Пары гексапептидов, принадлежащих одной и той же паре элементов вторичной структуры, объединяются. Из них выбирается одна пара – та, для которой среднее расстояние между гексапептидами минимально. 2.Пары со средним расстоянием между гексапептидами более 25 ангстрем не рассматриваются 3.Пары упорядочиваются по среднему расстоянию между гексапептидами

2)Отбор пар сходных пар гексапептидов При сравнении пар гексапептидов из разных структур используются методы быстрой фильтрации непохожих пар: – по различию средних расстояний между гексапептидами; – по различию сумм матричных элементов по строкам (столбцам )

3) Завершение списка пар сходных пар 1.Порядок рассмотрения пар гексапептидов – по среднему расстоянию между ними, от пар с меньшим расстоянием к парам с большим. 2.Список сходных пар гексапептидов закрывается если либо (1) среднее расстояние между парами гексапептидов превышает 25 ангстрем либо (2) список достигает пар сходных гексапептидов Не более пар пар с лучшим весом S отправляются на следующий шаг – построение выравнивания

3.Отбор зародышей выравнивания – троек гексапептидов 1)Если –(A, A) сходна с (B,B) и гексапептиды A, A, A (соотв., B, B, B) не пересекаются, то вычисляется сходство S наборов (A,A, A) с (B, B, B) 2)При достаточном сходстве эти наборы считаются зародышем пространственного выравнивания 3)Список зародышей ограничен числом 100

4.Каждый зародыш дает начало траектории наращивания выравнивания (A i, B i ), i=1,2,… 1)Обозначим зародыш (A, A, A; B, B, B) через (A 0, B 0 ) 2)(A i+1, B i+1 ) строится из (A i, B i ) добавлением одной из пар гексапептидов (ПГ), пересекающейся с (A i+1, B i+1 ) –ПГ выбирается случайно, с вероятностью p, зависящей от того, насколько сходство S нового выравнивания больше сходства S выравнивания (A i, B i ). Есть ненулевая вероятность выбрать худшее сходство! 3)На 1м и каждом 5м шагу происходит ревизия выравнивания (A i, B i ) – удаляются тетрапептиды, дающие отрицательный вклад в сходство 4)Траектория останавливается после того, как сходство перестает растит за 20 последних шагов

5.Фильтр траекторий Все траектории продолжаются параллельно. Траектория отбрасывается, если Сходство выравнивания существенно отстает от сходства для лидирующей траектории Выравнивание пересекается более, чем на 80% с выравниванием с лучшим сходство на другой траектории

6.Оптимизация лучшей траектории после завершения всех траекторий 1)10 раз удаляются из выравнивания случайно выбранные 30% тетрапептидов 2)Получившиеся 10 выравниваний наращиваются по тому же алгоритму 3)Выравнивание с лучшим сходством оставляется

7.Результат 1)Лучшее структурное выравнивание, число структурно сопоставленных остатков, Z-score 2)Альтернативные структурные выравнивания Для каждого выравнивания можно -совместить полипептидные цепи при данном выравнивании -визуально убедиться в его правильности - рассчитать rmsd по сопоставленным C