Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?

Презентация:



Advertisements
Похожие презентации
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
Advertisements

Семейства белков. Мотив и распознающее правило. БД Pfam, InterPro. А.Б.Рахманинова, 2010, второй семестр.
Быстрые пути эволюции белков. Домен. БД PFAM, InterPro. Четвертый семестр, занятие 6, 2010, А.Б.Рахманинова.
Семейства белков Паттерны и профили I курс, весна 2009, О.Н. Занегина.
Семейства белков Pfam Rubens: Holy Family with St Elizabeth.
Быстрые пути эволюции белков. Эволюционный домен. БД PFAM.
Множественные выравнивания как метод исследования Материалы к занятиям IV блока курса биоинформатики, 2006 А.Б.Рахманинова.

Типовые расчёты Растворы
Маршрутный лист «Числа до 100» ? ? ?
Michael Jackson
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Урок повторения по теме: «Сила». Задание 1 Задание 2.
1 Анна Юфкина Специалист по бизнес-решениям

Эволюция семейства белков Эволюционные домены и их выравнивание.
1. Определить последовательность проезда перекрестка
Последовательности белков Эволюционные домены и их выравнивание С.А.Спирин,
Школьная форма Презентация для родительского собрания.
ЗРИТЕЛЬНЫЕ ИЛЛЮЗИИ ОПТИЧЕСКИЕ ОБМАНЫ 1. Зрительная иллюзия – не соответствующее действительности представление видимого явления или предмета из-за особенностей.
Транксрипт:

Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?

Что будем искать ? НАД-связывающий сайт/центр Сайты возможной посттрансляционной модификации (РТМ) Домен 1Домен 2 Гомологичное семейство: особенности последовательностей, характерный тип структуры, функции, таксономия и т.п. Семейство 1 Семейство 3 Семейство 2 «Похожие» семейства Ортологи

Паттерн (pattern) – Позиционно специфическая матрица весов (PSSM) – Профиль–PSSM – Профиль–HМM - Подпись (signature) – «Oтпечатки пальцев» (fingerprints) – Кластер - Место, сайт(site) - Мотив (motif) – Домен (domain) – Семейство – Суперсемейство - Основные понятия и термины ?

Домен – единица эволюции, структуры и функции белков. Домен – компактная, относительно независимо сворачивающаяся структура, относительно консервативная в процессе эволюции. Белки могут состоять из одного или многих доменов. nitrogen fixation positive activator protein

Мотив ? Мотив в аминокислотной последовательности - набор консервативных остатков, важных для функции белка и расположенных на определенном (обычно коротком) расстоянии друг от друга в последовательности. Мотив структуры (структурный мотив) – часто встречающийся в белках элемент пространственной структуры ( -спираль, - шпилька, -поворот). В общем случае, структурные мотивы не обязательно соответствуют мотивам в аминокислотным последовательностях. Один домен может содержать один или несколько мотивов в аминокислотной последовательности. Мотив может не входить в домены. Не в любом выравнивании легко найти мотив.

Интуитивно понятно: Семейство - группа белков, имеющая общее происхождение, их аминокислотные последовательности выравниваются по всей длине со значимым весом и имеют сходную доменную структуру. Мнения расходятся, когда речь идет о критериях: насколько должны быть похожи белки одного семейства (id>=30%, id>= 50%) ??? должны белки одного семейства выполнять одну и ту же функцию?? Superfamily Family Subfamily

No comments

Паттерн (pattern) – Позиционно специфическая матрица весов (PSSM) – Профиль–PSSM – Профиль–HМM - Подпись (signature) – «Oтпечатки пальцев» (fingerprints) - Место, сайт(site) - Мотив (motif) – Домен (domain) – Семейство – Суперсемейство - Основные понятия и термины ?

Банки белковых семейств и доменов, производные от банков аминокислотных последовательностей Коллекции мотивов Коллекции доменов PROSITE, 1989 Pfam BLOCKS SMART PRINTS ProDom, 1995 SUPERFAMILY InterPro, 1999 (Integrated Resource of Protein Families)

PROSITE - биологически значимые сайты, паттерны и профили Выравнивание хорошо изучен- ного семейства Функционально важные остатки 4-5 консервативных остатков Паттерн Если находим только«пра- вильные», то ОК Если много лишнего, то увеличиваем паттерн Поиск в SP Паттерн – регулярное выражение UNIXa: [AC]-x-V-x(4)-{ED} Ala или Cys- х-Val- х- х- х - х- (любой, но не Glu или Asp)

PROSITE - биологически значимые сайты, паттерны и профили

PROSITE Релиз 18.25, документов, 1706 разных паттернов, правил и профилей. Профиль или весовая матрица F K L L S H C L L V F K A F G Q T M F Q Y P I V G Q E L L G F P V V K E A I L K F K V L A A V I A D L E F I S E C I I Q F K L L G N V L V C A C D E F G H I K L M N P Q R S T V W Y

Pfam Большая коллекция множественных выравниваний, доменов, семейств и профилей-HMM для них. Состоит из 2-х частей: PfamA – курируемая часть, покрывает 73% SWISS-Prot+TrEMBL PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов ProDom, не вошедших в PfamA. Удобна для анализа доменной структуры белков.

Pfam 1.Множественное выравнивание (ClustalX) некоторого семейства или кластера. 2.Экспертиза и корректировка выравнивания- затравки. 3.Построение профиля-НММ для затравки. 4.Поиск в базе данных а.к.последовательностей новых членов данной группы.

ProDom Рассматриваются все последовательности в SWISS- Prot+TrEMBL. Автоматическое выделение доменов (программа DOMAINER: сначала локальное попарное выравнивание (blastp) всех против всех, затем кластеризация) Коллекция доменов - > семейств. Некоторые семейства выделены на основе выравниваний из PfamA. Гомогенность семейства оценивается с помощью диаметра (max расстояния между 2 доменами в семействе) и радиуса (ср.кв. расстояние между доменами и консенсусом семейства). Оба параметра измеряются в РАМ

Статистика ProDom Всего – семейств из них содержат более 2 последовательностей. Среднее число доменов в последовательности – 2.8 Средняя длина – ~ 130 а.к. остатков

Pfam Prosite Prints Blocks Smart (ProDom, PIRaln, ProClass, Systers, Picasso etc. not shown) Example: ENTK_HUMAN (Enteropeptidase precursor) Comparison of protein family databases: an example

Создание интегрированной базы данных InterPro PROSITE PFAM PRINTS InterPro entries IPR IPR Интегрирование родственных подписей «вручную» ProDom SMART TIGRFAMs PIRSF SUPERFAMILY InterPro- an inte grated r esource of pro tein families, domains and functional sites.

Entry types in InterPro Family - group of evolutionarily related proteins, that share one or more domains/repeats in common. Domain -independent structural unit which can be found alone or in conjunction with other domains or repeats. Repeat -region occurring more than once that is not expected to fold into a globular domain on its own. PTM (post-translational modification) -The sequence motif is defined by the molecular recognition of this region in a cell. Active site -catalytic pockets of enzymes where the catalytic residues are known. Binding site –binds compounds but is not necessarily involved in catalysis.

Взаимосвязи подписей в InterPro Parent/child уровень семейства Contains/found in состав домена

Parent/child- family level

Contains/found in

PROTOMAP Automatic classification of all SWISS-PROT proteins into groups of related proteins (also including TrEMBL now) Based on pairwise similarities Has hierarchical organisation for sub- and super- family distinctions clusters, proteins, Keeps SP annotation eg description, keywords Can search with a sequence -classify it into existing clusters