Сравнительная геномика и метаболическая реконструкция: что можно сказать об организме, зная только его геном М.С.Гельфанд (ИППИ РАН) 3-й съезд ВОГиС, Москва, июнь 2004
красный: статьи синий: последовательности
Анализ индивидуальных генов Поиск родственных белков в банках последовательностей – перенос функции от гомологов Функциональные сайты (каталитические центры) Функциональные участки (трансмембранные сегменты, сигнальные пептиды и т.п.)
Анализ на уровне индивидуальных генов даёт возможность охарактеризовать 50-75% генов в новом геноме Но: ~100 универсально отсутствующих генов (нет ни одного известного гена для известной функции) множество функций, для которых неизвестны представители в больших таксонах в каждом геноме ~5-10% консервативных генов с неизвестной функцией трудно предсказывать специфичность в мультигенных семействах (транспортёры, факторы транскрипции) нельзя найти что-то принципиально новое
Полные геномы
Сравнительная геномика и метаболическая реконструкция Метаболическая реконструкция Идентификация пробелов Позиционный анализ (гены и домены) Анализ филогенетического распределения Анализ регуляторных сигналов Отнесение генов к функциональным и метаболическим системам Уточнение специфичности
Утилизация пектина E. chrysanthemi
… и транспорт олигогалактуронатов E. chrysanthemi Y. pestis K. pneumoniae
предсказание и подтверждение
Новые члены регулона KdgR у E. chrysanthemi + ppsA фосфоенолпируват-синтаза +ydiA – chmX хемотаксис (акцептор метила) – dhfX периплазматическая эстераза – spiX изомераза (аналог KduI) –yjgK участвует в нижней части пути –tpfX – ydiV транспортер – sotA экспорт сахаров (токсичных интермедиатов?) –gntDBMNAC ABC-транспортер – yeeO транспортер
YpaA: транспортёр рибофлавина 5 предсказанных ТМ-сегментов => потенциальный транспортёр регуляторный RFN-элемент => ко- регуляция с генами метаболизма рибофлавина => транспорт рибофлавина или предшественника S. pyogenes, E. faecalis, Listeria: есть ypaA, нет генов биосинтеза рибофлавина => транспорт рибофлавина Предсказание: YpaA – рибофлавиновый транспортёр (Gelfand et al., 1999) Проверка: YpaA переносит рибофлавин (генетический анализ, Кренева и др., 2000 ) ypaA регулируется рибофлавином (анализ экспрессии на микрочипах, Lee et al., 2001; прямой эксперимент, Winkler et al., 2002 ).
Новое семейство транспортёров аминокислот S-box (rectangle frame) MetJ (circle frame) LYS-element (circles) Tyr-T-box (rectangles) malate/lactate
Метаболическая реконструкция пути биосинтеза лизина
Идентификация пути ацетилированных интермедиатов в B. subtilis и родственных бактериях - 0 dapD (yquQ): ортолог известного гена E. coli
Идентификация пути ацетилированных интермедиатов в B. subtilis и родственных бактериях - 1 patA: пиридоксаль-фосфат- зависимая аминотрансфераза (по гомологии) ко-локализуется и ко- регулируется с генами биосинтеза лизина во многих грам-положительных бактериях
Идентификация пути ацетилированных интермедиатов в B. subtilis и родственных бактериях - 2 ykuR: N-ацил-L-аминокислота амидогидролаза (по гомологии) ко-локализуется и ко- регулируется с геном биосинтеза лизина dapD во многих грам- положительных бактериях в некоторых случаях принадлежит к большому лизиновому оперону, регулируемому LYS-элементом
Идентификация пути ацетилированных интермедиатов в B. subtilis и родственных бактериях - 3 dapX: dapF отсутствует у некоторых бактерий (Staphylococcus aureus, Oenococcus oeni, Leuconostoc mesenteroides) во всех этих геномах есть dapX, гомологичный аланиновой рацемазе и другим эпимеразам в S. aureus dapX принадлежит к большому лизиновому оперону в O. oeni оперон dapX-asd регулируется LYS-элемен dapX том
Метаболическая реконструкция пути биосинтеза кобаламина (витамина В12) идентификация новых ферментов, транспортёров кобаламина, промежуточных продуктов и кобальта
Предсказания: ферменты синтез жирных кислот: FadR синтез тиамина: ThiN биосинтез лизина – путь ацетилированных интермедиатов обратный путь синтеза цистеина из метионина и путь ре-утилизации метионина биосинтез кобаламина: ChlID, BluB, PduO, PduX, CobY, CobZ, CblXY, CblZ, BhiB, BtuS пути катаболизма различных сахаров и олигосахаридов синтез триптофана и фолата: семейство TrpG/PabA биосинтез биотина: BioZ, BioK
Предсказания: транспортёры аминокислоты –метионин –тирозин –триптофан –лизин –аргинин –гистидин нуклеотиды сахара и олигосахариды –в том числе, важные для патогенеза (стрептококки, растительные патогены) металлы –железо –цинк –кобальт –никель витамины и их предшественники –биотин –тиамин (В1) –рибофлавин (В2) –кобаламин (В12)
Предсказания: регуляторные сигналы MtaR (метиониновый репрессор стрептококков) BioR (биотиновый репрессор – бактерии и археи) ZUR и AdcR (цинковые репрессоры) регуляция катаболизма сахаров и олигосахаридов (несколько десятков регуляторов) регуляция синтеза ароматических аминокислот (стрептококки) регуляция систем ответа на перенаселение (quorum sensing – лактококки и лактобациллы) РНКовые переключатели (рибофлавин, тиамин) аттенюаторы аминокислотных оперонов регуляторные системы архей (тепловой шок, пурины, утилизация азота, синтез триптофана)
Подтверждённые предсказания предсказаниегеном(ы) аргининовый транспортёр yqiXYZ: специфичность и регуляция бактерии (Bacillus subtilis) рибофлавиновый транспортёр YpaA: специфичность и регуляция Грам-положительные бактерии (Bacillus subtilis) ацил-КоА дегидрогеназа FadE кодируется геном yafH гамма-протеобактерии (Escherichia coli) рибофлавиновый РНК-переключательбактерии (Bacillus subtilis, Escherichia coli) тиаминовый РНК-переключательбактерии и археи (Bacillus subtilis, Escherichia coli) ThiN (= ThiD), биосинтез тиаминаT. maritima, археи (Methanobacterium thermoautotrophicum) метиониновый транспортёр MetDBacillus subtilis, Escherichia coli транспортёр олигогалактуронидов ogtABCD (togMNAB) гамма-протеобактерии (Erwinia chrysanthemi)
Сравнительная геномика систем утилизации цинка Две роли цинка в бактериях: Структурная в ДНК-полимеразах, праймазах, рибосомных белках Каталитическая в протеазах и других белках
Геномы и регуляторы nZUR FUR family ??? AdcR ? MarR family pZUR FUR family
Регуляторы и сигналы nZUR- AdcRpZUR TTAACYRGTTAA GATATGTTATAACATATC GAAATGTTATANTATAACATTTC GTAATGTAATAACATTAC TAAATCGTAATNATTACGATTTA
Выравнивание сигналов nZUR GTAATGTAA TAACATTAC (alpha – most genera) GATATGTTA TAACATATC (alpha – Rhodobacter) GAAATGTTATANTATAACATTTC (gamma) GaaATGTtA-----TAACATttC (consensus of consensi)
Транспортеры Ортологи транспортных систем AdcABC и YciC Паралоги компонентов систем AdcABC и YciC Потенциальные транспортеры с ранее не известной специфичностью
zinT: регуляция zinT одиночный домен: adcA-zinT E. coli, S. typhi, K. pneumoniaeGamma-proteobacteria Alpha-proteobacteria B. subtilis, S. aureus S. pneumoniae, S. mutans, S. pyogenes, L. lactis, E. faecalis Bacillus group Streptococcus group zinT регулируется цинковыми репрессорами (nZUR-, nZUR-, pZUR) adcA-zinT регулируется цинковыми репрессорами (pZUR, AdcR) (ex. L.l.) A. tumefaciens, R. sphaeroides
ZinT: анализ белковой последовательности E. coli, S. typhi, K. pneumoniae, A. tumefaciens, R. sphaeroides, B. subtilis L. lactis Y. pestis, V. cholerae, B. halodurans TMZnAdcA S. aureus, E. faecalis, S. pneumoniae, S. mutans, S. pyogenes ZinT
ZinT: резюме ZinT часто является доменом цинкового транспортёра zinT экспрессируется при недостатке цинка ZinT локализован на поверхности клетки (имеет трансмембранный якорь) ZinT имеет цинк-связывающий домен вывод: ZinT – новый тип цинк-связывающей компоненты ABC транспортёра
Регуляция белков PHT (pneumococcal histidine triad) в стрептококках S. pneumoniae S. equi S. agalactiae lmbphtDphtE phtBphtA lmbphtD S. pyogenes phtY lmbphtD регуляция цинком показана экспериментально
Структурные свойства белков PHT Белки PHT содержат множественные копии мотива HxxHxH Белки PHT из S. pneumoniae – это паралоги с уровнем сходства 65-95% Белки PHT имеют N-концевые гидрофобные пептиды Локализация белков PHT из S. pneumoniae на поверхности бактериальной клетки была показана проточной цитометрией
Белки PHT: экспрессируются в условиях недостатка цинка локализуются на поверхности клеточной мембраны содержат цинк-связывающие мотивы Гипотеза: это новое семейство транспортёров цинка
… неверно цинк-связывающие мотивы в транспортёрах: EEEHEEHDHGEHEHSH HSHEEHGHEEDDHDHSH EEHGHEEDDHHHHHDED DEHGEGHEEEHGHEH (гистидин-аспартат- глутамат) гистидиновые триады в белках PHT: HGDHYHY 7 out of 21 HGDHYHF 2 out of 21 HGNHYHF 2 out of 21 HYDHYHN 2 out of 21 HMTHSHW 2 out of 21 (специфическое расположение гистидинов и ароматических аминокислот)
… продолжение анализа Ген phtD входит в оперон с геном lmb во всех стрептококках –Lmb: адгезин, участвующий в связывании стрептококков с эпителиальными клетками PhtY в S. pyogenes: –phtY регулируется AdcR –PhtY состоит из трех доменов: PHTinternalinH-rich 4 HIS TRIADS LRR IR HDYNHNHTYEDEEGH AHEHRDKDDHDHEHED
Белки PHТ: вторая попытка белки PHT продуцируются при недостатке цинка белки PHT локализуются на поверхности клетки белки PHT содержат цинк-связывающие мотивы phtD образует потенциальный оперон с геном адгезина PhtY содержит домен интерналина отвечающий за инвазию Гипотеза Белки PHT – это адгезины связанные с прикреплением к клетке хозяина для дальнейшей инвазии
Цинк и паралоги белков рибосом L36L33L31S14 E. coli, S.typhi ––– +– K. pneumoniae ––– – Y. pestis,V. cholerae – –– +– B subtilis –– + –– + S. aureus –– – ––– + Listeria spp. –– –– + E. faecalis – – – – –– + – S. pne., S. mutans –– – ––– S. pyo., L. lactis –– – ––– + nZUR pZUR AdcR
(в скобках – мотив «цинковая лента») L36L33L31S14 E. coli, S.typhi (–)–(–) +– K. pneumoniae (–)–(–) –– Y. pestis,V. cholerae (–) –(–) +– B subtilis (–)(–) + –(–) + S. aureus (–)(–) – ––(–) + Listeria spp. (–)(–) ––(–) + E. faecalis (–) (–) – – –(–) + – S. pne., S. mutans (–)(–) – ––(–) S. pyo., L. lactis (–)(–) – ––(–) + nZUR pZUR AdcR
Сводка наблюдений: Makarova-Ponomarev-Koonin, 2001: –L36, L33, L31, S14 – это единственные рибосомные белки, дуплицированные более, чем в одном геноме –L36, L33, L31, S14 – четыре из семи рибосомных белков, содержащих мотив цинковой ленты (четыре цистеина) –Из двух (или более) копий L36, L33, L31, S1, обычно одна содержит мотив цинковой ленты, а другая – нет Среди генов, кодирующих паралоги рибосомных белков, как правило одни регулируется цинковым репрессором, а соответствующий белок никогда не имеет мотива цинковой ленты
Плохой сценарий достаточно цинка недостаточно цинка: весь цинк потреблен рибосомами, ферменты голодают
Хороший сценарий достаточно цинка недостаточно цинка: часть рибосом включает белки, не содержащие цинка – остается для ферментов
Регуляторный механизм ribosomes Zn-dependent enzymes R Sufficient Zn Zn starvation R repressor
Предсказание … (Proc Natl Acad Sci U S A Aug 19;100(17): ) … и подтверждение (Mol Microbiol Apr;52(1): )
Перспективы Другие типы данных –Экспрессия генов на олигонуклеотидных чипах –Концентрации метаболитов –Протеомика: концентрации белков –Белок-белковые взаимодействия –Белок-ДНКовые взаимодействия Автоматизация Эукариоты Моделирование метаболизма –Потоковые алгоритмы –Связь с результатами геномного анализа
А.А.Миронов А.Б.Рахманинова В.Ю.Макеев М.А.Ройтберг В.А.Любецкий Eugene Koonin Andrei Osterman Pavel Pevzner Nicole Hugovieux-Cotte- Pattat П.Новичков Д.Родионов А.Витрещак Е.Панина Э.Пермина О.Лайкова А.Казаков А.Герасимова Е.Котельникова Н.Садовская Д.Равчеев Г.Ковалёва