Выравнивания (продолжение) С.А.Спирин, 2011
Пути эволюции последовательностей В основе случайное изменение нуклеотидной последовательности ДНК: – точечные замены, – дупликации, – рекомбинации. Давление естественного отбора направлено на функциональные свойства последовательности, например, на свойства кодируемого белка или на свойства регуляторного участка ДНК. Разные изменения нуклеотидной последовательности гена в разной степени влияют на функциональные свойства кодируемого белка.
Гомологичные последовательности – это последовательности, имеющие общее происхождение (общего предка). Признаки гомологичности белков сходная 3D-структура в той или иной степени похожая аминокислотная последовательность разные другие соображения… Основные понятия биоинформатики
Сходная пространственная структура Наложение остовных моделей двух гомологичных белков
Гомологи Ортологи Паралоги Ксенологи ? ( W.M.Fitch, Syst.Zool.19,99(1970) Основные понятия биоинформатики
Ортологи последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одну и ту же функцию Паралоги последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разные функции. Основные понятия биоинформатики
«Идеальное» выравнивание – запись последовательностей одной под другой так, чтобы гомологичные фрагменты оказались друг под другом. домовой скупидом водомерка ? лесовоз---лесо---воз ледоходлед---оход--- ?
Гэп – пропуск в последовательности Задача выравнивания последовательностей часто сводится к задаче поиска сходства. Сходство не то же, что гомология !
Как оценить сходство двух последовательностей одним числом?
Вес выравнивания Sequence 1LHL––SHVQ Sequence 2LILEPSHFQ Вес позиции4–34–12–248–15 Вес выравнивания равен 7
# Matrix made by matblas from blosum62.iij # * column uses minimum score # BLOSUM Clustered Scoring Matrix in 1/2 Bit Units # Blocks Database = /data/blocks_5.0/blocks.dat # Cluster Percentage: >= 62 # Entropy = , Expected = A R N D C Q E G H I L K M F P S T W Y V B Z X * A R N D C Q E G H I L K M F P S T W Y V B Z X *
Вес выравнивания Вес выравнивания получается как сумма весов пар сопоставленных букв, из которой вычитаются штрафы за пропуски. Веса пар букв берутся из матрицы. Считается, что лучшая матрица – BLOSUM62 Штрафы за пропуски, как правило, складываются из штрафов за начало пропуска (непрерывной последовательности символов «–») и штрафов за удлинение пропуска. Тем самым величина штрафов за пропуски для данного выравнивания определяется двумя параметрами.
(С) А.Б.Рахманинова Змей-Горыныч биоинформатики Биологическая задача поставить друг под другом гомологичные позиции Математическая задача найти способ количественного сравнения качества выравниваний. Программирование создание эффективного алгоритма и его реализация
Для парных выравниваний достигнуто приемлемое согласие между «головами» Математическая модель качества выравнивания – вес (Score) Алгоритмы, достаточно быстро находящие выравнивание с наибольшим весом: алгоритм Нидельмана – Вунша (Needleman – Wunsch, 1970) – для полных выравниваний алгоритм Смита – Уотермэна (или Смита – Ватермана, Smith – Waterman, 1981) – для частичных выравниваний