Распознавание регуляторных сигналов Факультет биоинженерии и биоинформатики МГУ 2-й курс (набор 2006 года) Осенний семестр 2007 Д. А. Равчеев, М. С. Гельфанд В. Ю. Макеев (некторые слайды)
Транскрипция и трансляция в прокариотах
Эукариоты Прокариоты 1. Сопряжение транскрипции и трансляции 2. Котранскрипция нескольких генов (опероны) 1.Транскрипция 2. Процессинг пре-мРНК 3. Экспорт мРНК 4.Трансляция (синтез пре-мРНК) l кэпирование сплайсинг l сплайсинг l полиаденилирование
Сплайсинг ( эукариоты ) Сборка сплайсосомы Разрез на 5 конце интрона, образование «аркана» Разрез на 3 конце интрона, соединение экзонов
Транскрипция в прокариотах : Инициация транскрипции Направление транскрипции Старт транскрипции Промотор
Транскрипция в прокариотах : Регуляция транскрипции РепрессияАктивация
Структура ДНК-связывающего домена CI, фаг
Структура ДНК-связывающего домена Cro, фаг
Белок-ДНКовые взаимодействия CI Cro
Регуляция транскрипции у эукариот
Один и тот же ген может регулироваться несколькими регуляторными модулями, работающими в разных условиях Расстояние от регуляторного модуля до кодирующих областей может достигать пар оснований Регуляция транскрипции у эукариот Регуляторные модули ( В. Ю. Макеев )
Консенсус Pattern (образец - консенсус с вырoжденными позициями) Матрица частот, nucleotide frequency matrix Позиционная весовая матрица (или профиль) positional weight matrix, PWM, profile Логические правила РНКовые сигналы – вторичная структура Представление сигналов
Консенсус CCTACGCAAACGTTTTCTTTTT GTCTCGCAAACGTTTGCTTTCC CACACGCAAACGTTTTCGTTTA TCCACGCAAACGGTTTCGTCAG GCCACGCAACCGTTTTCCTTGC GATACGCAAACGTGTGCGTCTG CCGACGCAATCGGTTACCTTGA GTTGCGCAAACGTTTTCGTTAC TTGAGGAAAACGATTGGCTGAA TTTAAGCAAACGGTGATTTTGA TAGATGCAATCGGTTACGCTCT TAAAGGCAAACGTTTACCTTGC AACGAGCAAACGTTTCCACTAC ACGAAAACGTTTTCGT Сайты связывания PurR E. coli cvpA purM purT purL purE purC purB purH purA 1 purA 2 guaB purR 1 purR 2 consensus
Образец cvpA purM purT purL purE purC purB purH purA 1 purA 2 guaB purR 1 purR 2 consensus pattern CCTACGCAAACGTTTTCTTTTT GTCTCGCAAACGTTTGCTTTCC CACACGCAAACGTTTTCGTTTA TCCACGCAAACGGTTTCGTCAG GCCACGCAACCGTTTTCCTTGC GATACGCAAACGTGTGCGTCTG CCGACGCAATCGGTTACCTTGA GTTGCGCAAACGTTTTCGTTAC TTGAGGAAAACGATTGGCTGAA TTTAAGCAAACGGTGATTTTGA TAGATGCAATCGGTTACGCTCT TAAAGGCAAACGTTTACCTTGC AACGAGCAAACGTTTCCACTAC ACGAAAACGTTTTCGT amGAAAaCGkTTwCwT Сайты связывания PurR E. coli
Матрица частот Сайты связывания PurR E. coli Информационное содержание : I = j b f (b, j) [log f (b, j) / p (b)] f (b, j) – частота нуклеотида b в позиции j p (b) – частота нуклеотида в геноме где
Диаграмма Лого ( Logo ) Сайты связывания PurR E. coli I = j b f (b, j) [log f (b, j) / p (b)]
Позиционная весовая матрица (профиль ) W (b, j) = ln [N (b, j)+0,5] – 0,25 i ln [N (i, j)+0,5]
Позиционная весовая матрица (профиль ) Термодинамическая мотивировка : свободная энергия Предположение : независимость соседних позиций
Начало: Исправление ошибок Проверка литературных данных Удаление дубликатов Составление выборки GenBank специализированные банки данных (EcoCyc, RegDB) литература (обзоры) литература (оригинальные статьи) предсказанные сайты
Первоначальное выравнивание по биологическим признакам Выделение сигнала в скользящем окне Перевыраванивание и т.д. пока не сойдётся Перевыравнивание промоторы : старт транскрипции участки связывания рибосом : стартовый кодон сайты сплайсинга : экзон-интронные границы
Начала генов Bacillus subtilis
Позиционное информационное содержание до и после перевыравнивания после до