Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина
Что мы можем узнать нового? Попарное выравнивание: Множественное выравнивание:
Что можно сказать про новый белок? Новый белок с неизвестной функцией Белок А Белок В ДНК-связывающий участок АТФ – связывающий участок
Полезно заранее знать важные (сходные) участки последовательности/структуры Site (сайт) Мотив кластер малых молекул домен В белках можно выделять
Домен – единица эволюции, структуры и функции белков Домен – компактная, относительно независимо сворачивающаяся структура, относительно консервативная в процессе эволюции. Белки могут состоять из одного или многих доменов.
Мотив – широкое понятие Мотив в аминокислотной последовательности Структурный мотив часто встречающийся в белках элемент пространственной структуры набор консервативных остатков, важных для функции белка и расположенных на определенном (обычно коротком) расстоянии друг от друга в последовательности не всегда соответствуют друг другу Мотив 1Мотив 2Мотив 3Мотив 4 Домен из одного или нескольких мотивовМотив, не входящий в домен
Мотив в аминокислотной последовательности: как искать? Функционально важные остатки Что тут общее? ? С ? ? С R ? ? K ? ? C ? ? ? ? ? ? C ? ? C ? ? ? ? ? ? C Принятая форма записи [GASTPV]-C-x(2)-C-[RKHSTACW]-x(2)-[RKHQ]- x(2)-C-x(5,12)-C-x(2)-C-x(6,8)-C Паттерн
Как создать паттерн? Выравнивание хорошо изученного семейства Функционально важные остатки 4-5 консервативных остатков Паттерн Если находим только«правильные», то ОК Если много лишнего, то увеличиваем паттерн Поиск в UniProt xлюбая а/к [AT]Ala или Thr {CR}кроме Cys и Arg K(3)K-K-K X(2,4)x-x или x-x-x или x-x-x-x / A(2,4) C- конец [AC]-x-V-x(4)-{ED}
Профиль или весовая матрица (PSSM) Seq1 F K L L S H C L L V Seq2F K A F G Q T M F Q Seq3Y P I V G Q E L L G Seq4 F P V V K E A I L K Seq5 F K V L A A V I A D Seq6 L E F I S E C I I Q Seq7 F K L L G N V L V C A C D E F G H I K L M N P Q R S T V W Y Паттерн: F-[KP]-x(3)-[EQ]-x(4) Не найдем! Позиционно- специфичная матрица весов аминокислот
PROSITE биологически значимые сайты, паттерны и профили, Содержит описание объектов + описание паттернов, профилей и правил для их обнаружения. БД белковых доменов, семейств и функциональных сайтов Релиз Apr документов, 1308 паттернов, 845 профилей ProRule
Найдено лишнее Не найдено нужное Качество паттерна