Быстрые пути эволюции белков. Домен. БД PFAM, InterPro. Четвертый семестр, занятие 6, 2010, А.Б.Рахманинова
Первые же попытки классификации коллекций аминокислотных последовательностей показали существование семейств гомологичных белков консервативных мотивов в негомологичных белках
Домен – относительно консервативный в процессе эволюции непрерывный и достаточно длинный фрагмент последовательности. Последовательность может содержать один или несколько доменов
Домены, найденные в последовательностях, часто, но далеко не всегда совпадают со структурными доменами.
Словарик Типы мотивовТипы подписей С айт(site) - Мотив (motif) – Повтор (repeat) – Домен (domain) – Семейство – Суперсемейство - Паттерн (pattern) – Профиль–PSSM – Профиль–HМM - ….. CCHC- цинксвязывающий мотив Подпись типа паттерн – CX2CX4HX4C Простой пример:
Ничто удачное не должно пропасть даром Точечные мутации медленный путь эволюции Быстрый путь дупликация Дуплицируются короткие фрагменты, домены, гены, кластеры генов, хромосомы, геномы Вторая копия может приобрести новые функции Почему это интересно?
Ортологи последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию Паралоги последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разные функции. Пример 1: дупликация генов (повторяем)
Comparison of gene structures and their sequence similarities. Logsdon J M, Doolittle W F PNAS 1997;94: ©1997 by The National Academy of Sciences of the USA Пример 2: дупликация короткого повтора
25 белков 9 белков 2 белка 12 белков 223 белка 243 белка 507 белков ЕС ЕС ЕС Пример доменных перестроек: не только дупликации!
Пример 4
Домен – единица эволюции, структуры и функции белков. Домен – компактная, относительно независимо сворачивающаяся структура, относительно консервативная в процессе эволюции. Белок может состоять из одного или многих доменов.
Pfam Большая коллекция семейств доменов Для каждого семейства есть множественное выравнивание и профиль-HMM. Состоит из 2-х частей: PfamA – курируемая часть, покрывает 76% UniProt PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов, не вошедших в PfamA (раньше – ProDom, теперь – ADDA). Удобна для анализа доменной структуры белков.
Язык Pfam : Семейство – коллекция гомологичных белков. Домен – структурная единица, которую можно найти во множественном выравнивании. Повтор – короткая единица, нестабильная сама по себе, но образует стабильные структуры, если есть много копий. Мотив – короткая единица структуры вне глобулярных доменов. Клан – группа родственных записей.
Pfam Prosite Prints Blocks Smart (ProDom, PIRaln, ProClass, Systers, Picasso etc. not shown) Сравн ите
Создание интегрированной базы данных InterPro PROSITE PFAM PRINTS InterPro entries IPR IPR Интегрирование родственных подписей «вручную» ProDom SMART TIGRFAMs PIRSF SUPERFAMILY InterPro- an inte grated r esource of pro tein families, domains and functional sites.