Выравнивание … … последовательностей белков и его биологический смысл
Что изображено? Название последовательности Номер столбца выравнивания Номер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ Консервативный остаток Функционально консервативная позиция
Правильно ли выровнены последовательности?
В чем биологический смысл выравнивания? Буквы в одной колонке определяют сопоставление аминокислотных остатков двух белков Сопоставленные остатки, по идее, должны иметь что-то общее в молекулах белка; что??? Предложение: биологический смысл имеет сопоставление одинаковых или функционально сходных остатков белка. Эти остатки играют сходную роль. Сопоставление непохожих остатков не имеет смысла.
Какое выравниваниеправильнее? 13 консервативных остатков 12 консервативных остатков
Чтобы понять смысл выравнивания, вернемся к тому, что такое последовательность аминокислотных остатков и что такое белок
(i)Последовательность – удобный способ закодировать структурную (химическую) формулу молекулы белка (до посттрансляционных модификаций) (iii) Последовательность определяет в какую пространственную структуру свернется белок в клетке (ii) Белок – это большая молекула, сохраняющая в живой клетке постоянную пространственную структуру, т.е.– взаимное расположение ковалентно связанных атомов (конформацию) (iv) Функция белка в клетке (и некоторые хим. свойства) проявляется только при сохранении уникальной пространственной структуры
Пространственное совмещение полипептидных цепей белков mta1_yeast и mat2_yeast На плоской картинке видно плохо
Белок Белок 1 Схематическое изображение совмещенных структур С α атомы Соответствие между С α атомами двух совмещенных структур, основанное на близости в пространстве
Другой способ отобразить совмещение полипептидных цепей называется структурным выравниванием последовательностей Стрелки как на предыдущем слайде Вставка трех остатков
Что вставить Пример получше Участки выравнивания, невыравнивания, разрывы/вставки Биологически обоснованное выравнивание Разметка Проблема Решение Анализ ответа
Совмещение структур и выравнивание последовательностей
Случайное совпадение C_alpha атомов в пространстве
Еще раз: разметка по совмещенным структурам
Биологически обоснованное выравнивание Включает выделение участков где выравнивание есть и тех, где выравнивания нет
См. файл homeo_5.ent скрипт homeo_5.spt * Совмещение доменов разных белков: - гомеодомена из белка MatA1 (1LE8:A, mta1_yeast) и - гомеодомена из белка Matα2 (1MNM:C, mat2_yeast) и еще трех гомеодоменов * Основная функция гомеодоменов – узнавание сайтов (участков с определенной последовательностью) ДНК и Связывание с ними для регуляции экспрессии генов
Биологически обоснованное выравнивание гомеодоменов
Совмещение 5-и гомеодоменов См. Homeo_5.ent
Множественное выравнивание гомеодоменов Красным выделены консервативные (одинаковые у всех) остатки; желтым – на 80% консервативные (одинаковые почти у всех) остатки Красным выделены консервативные и функционально консервативные остатки
Размеченное множественное выравнивание
Функции аминокислотных остатков Trp48 Arg53 Leu16 Pro442/ Lys442
См. Homeo_5.ent скрипт homeo_5_aa.spt
Мы видели белки с разной последовательностью, имеющие очень сходную укладку полипептидной цепи в пространстве * Зачем? * Почему?
Вывод: некоторые (не все!) остатки из одного столбца биологически обоснованного выравнивания имеют сходную функцию Поэтому в правильном выравнивании много консервативных аминокислотных остатков и функционально консервативных позиций
Выравнивание и эволюция Последовательности белка оболочки из двух штаммов вируса Коксаки
.. Последовательности белка оболочки из двух штаммов вируса Коксаки и энтеровируса человека
Аминокислотные остатки в одной колонке биологически обоснованного выравнивания, как правило, произошли из одного и того же остатка - их общего предка Кроме случаев лабораторного генно-инженерного мутагенеза это трудно проверить экспериментально!
ПРОБЛЕМА: как построитьправильное выравнивание последовательностей белков если структуры белков неизвестны?
Острота проблемы вытекает из статистики: На сегодня известны: последовательности примерно 5 млн(!!!) белков (большинство – гипотетические, как белок из записи Q9ZWN8_CERRI ) пространственные структуры около 30 тыс. белков
Алгоритмические решения проблемы воплощены в программах Программы выравнивания последовательностей тестируются путем сравнения с биологически обоснованными – построенными по совмещению структур – выравниваниями Существуют базы данных структурных выравниваний последовательностей (BAliBAse и др.)
Предположим, известны структуры родственных белков и, значит, биологически обоснованное выравнивание последовательностей При > 60% совпадающих букв любая современная программа даст (почти) правильный результат При < 20% совпадающих букв (такие примеры существуют) ни одна программа не даст правильного выравнивания Между 20% и 60%, обычно, результат программы частично правилен
(*) Справедливы ли положения с предыдущего слайда для выравнивания последовательностей ДНК? последовательностей РНК?
Итак, биологический смысл выравнивания последовательностей белков С α атомы остатков в одной колонке обоснованного выравнивания примерно одинаково расположены в структурах белков (с оговорками из-за возможных изменений конформации белка в процессе его функционирования) В части столбцов остатки всех белков имеют сходные функции Остатки из одной колонки обоснованного выравнивания, скорее всего, произошли от одного остатка общего предка белков