Автоматический поиск регуляторных сигналов перед генами в рамках функциональных подсистем. Ставровская Е.Д. 1,3, Сиприано М. 2, Дубчак И.Л. 2, Миронов А.А. 1, Гельфанд М.Г. 1,3 1 Факультет Биоинженерии и Биоинформатики, Московский Государственный Университет имени М.В. Ломоносова, Москва, Россия 2 Национальная лаборатория им. Лоуренса в Беркли, США 3 Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия
Постановка задачи биологический процесс сигнал регулон
Функциональная подсистема - набор функциональных ролей, которые составляют определенный биологический процесс или структурный комплекс. Функциональная роль - функция, которую выполняет белок
Три стратегии поиска сигналов + кластеризовать искать отдельно для каждого генома искать в рамках каждой функциональной роли искать для всех генов подсистемы
Поиск сигналов. SignalX Find best instances aagccgttgggagagcaggctatttcgggcttttgcagtccgtgaagacaatc ggcacagctcgaagctgctggcgccaaggttgaactcaagtaagtttggacta Cttgaaaaaaggaaaggcgattaatggaacccttttctcaacggtttagtaac ggaatttttgcaaaattccggttgcgctccgaaacttcgaggctggacccggg aagccgttgggagagcaggctatttcgggcttttgcagtccgtgaagacaatc ggcacagctcgaagctgctggcgccaaggttgaactcaagtaagtttggacta Cttgaaaaaaggaaaggcgattaatggaacccttttctcaacggtttagtaac ggaatttttgcaaaattccggttgcgctccgaaacttcgaggctggacccggg a c g t aagccgttgggagagcaggctatttcgggcttttgcagtccgtgaagacaatc ggcacagctcgaagctgctggcgccaaggttgaactcaagtaagtttggacta Cttgaaaaaaggaaaggcgattaatggaacccttttctcaacggtttagtaac ggaatttttgcaaaattccggttgcgctccgaaacttcgaggctggacccggg a c g t Build PWM And so on…
Кластеризация. ClusterTree-RS D ATAATCG ACAATCG AGAAACC CTAATCG ACAATCG ATAATCG ACAATCG AGAAACC CTAATCG ACAATCG … где Ik – информационное содержание в позиции k для общего набора сайтов [9], fj(i, k) – частота встречаемости нуклеотида i в позиции k для набора сайтов дочернего узла j, – среднее значение частоты в столбце k
Кластеризация. ClusterTree-RS где L – размер алфавита (L = 4), nj(i,k) количество нуклеотидов типа i в позиции k в дочернем узле, Nj -- количество сайтов в дочернем узле.
Перепредсказания накопление асимметрии области низкой сложности другие + =
Сравнение моделей модель как есть добавление комплиментарных сайтов + фильтр областей низкой сложности
Сравнение моделей модель как есть добавление комплиментарных сайтов + фильтр областей низкой сложности
Результаты 10 функциональных подсистем в геномах альфа- протеобактерий