Системная биология – сети М.Гельфанд «Сравнительная геномика» Би Би 4 курс, ШБ 2 год, ПФУ(КГУ) весна 2014
разные сети метаболические регуляторные сети (фактор-ген) белок-белковые взаимодействия синтетические летали …
свойства сетей N = количество вершин распределение степеней вершин P(k) = вероятность того, что у случайно взятой вершины будет k ребер средняя длина пути между вершинами L
случайная сеть пуассоновское распределение P(k) = exp(-λ) λ k / k! Теорема Эрдеша-Реньи: фазовый переход – возникновение гигантской компоненты средняя длина пути ~ log N
scale-free network (сеть, свободная от масштаба) P(k) ~ k –γ γ>3 – ничего особенного 2
Случайные и scale-free графы: P(k) (линейная и лог. шкалы)
Коэффи- циент кластеризации Мера связи между соседями данной вершины
Метаболическая сеть с птичьего полета
В деталях
Один путь (метаболизм аргинина и пролина)
Ранг vs. степень вершины для метаболитов и реакций в H. pylori
Transcription regulatory network in bakers yeast Downloaded from the YPD database: 1276 regulations among 682 proteins by 125 transcription factors (10 regulated genes per TF) Part of a bigger genetic regulatory network of 1772 regulations among 908 proteins Positive to negative ratio 3:1 Broader distribution of out-degrees (up to 72) and more narrow of in- degrees (up to 21)
регуляция транскрипции (дрожжи, ChIP-chip) A: in-degree (относительно регулируемых генов): гистограмма (в полулогарифмических координатах) количества промоторов с заданным числом регуляторов– экспоненциальное распределение (у большинства генов мало регуляторов). Пустые кружки – случайный граф В: out-degree (относительно факторов): гистограмма количества факторов, связывающих заданное количество промоторов – scale-free
Transcription regulatory network in Homo sapiens Data courtesy of Ariadne Genomics obtained from the literature search: 1449 regulations among 689 proteins Positive to negative ratio is 3:1 (again!) Broader distribution of out-degrees (up to 95) and more narrow of in-degrees (up to 40)
Transcription regulatory network in E. coli Data (courtesy of Uri Alon) was curated from the Regulon database: 606 interactions between 424 operons (by 116 TFs) Positive to negative ratio is 3:2 (different from eukaryots!) Broader distribution of out-degrees (up to 85) and more narrow of in-degrees (only up to 6 !)
Yeast protein interaction network Data from the high- throughput two-hybrid experiment (T. Ito, et al. PNAS (2001) ) The full set containing 4549 interactions among 3278 yeast proteins 87% nodes in the largest component The highest connected protein interacts with 285 others! Figure shows only nuclear proteins
Гигантская компонента в графе белок- белковых взаимодействий в дрожжах Красный – летальная мутация Оранжевый – медленный рост Желтый – неизвестно Зеленый – не летальная мутация
Белок-белковые взаимодействия в дрожжах: P(k) и размеры связных компонент
Синтети- ческие летали в дрожжах
Предостережения Экспериментальный шум (узлы и ребра) –Пропуски (не удается экспрессировать) –Лишнее (липкие белки, комплексы) Дискретизация Динамика, специфичность –время Клеточный цикл Условия –место Компартменты Ткани
Что смотрят Биологическая интерпретация положения белка/гена в сети Глобальные топологические свойства сетей Интересные подсети –«графушки», модули Эволюция –Моделирование –Сравнительный анализ (пока почти нет)
Глобальные свойства сетей Свобода от масштаба / степенное распределение – ой ли? Khanin R, Wit E. How scale-free are biological networks (J Comput Biol. 2006): … Here we study 10 published datasets of various biological interactions and perform goodness-of-fit tests to determine whether the given data is drawn from the power-law distribution. Our analysis did not identify a single interaction network that has a nonzero probability of being drawn from the power-law distribution.
зависимость физиологических и геномных свойств от топологии дрожжи: –~10% genes with 60% genes with >15 links are essential гены с большим числом связей –с большей вероятностью имеют ортологов в многоклеточных эукариотах –ближе к ортологам из C. elegans
Пьянки и свиданки Бимодальное распределение корреляций уровня экспрессии –Красный: hubs –Голубой: non-hubs –Черный: случайный граф Party hubs: сам и соседи ко-экспрессируются (комплексы) Date hub: нет корреляции в уровнях экспрессии (сигнальные пути)
Устойчивость к атаке (распадение гигантской компоненты) основа сети – party hubs Красный: атака на party hubs Коричневый: атака на все хабы Голубой: атака на date hubs Зеленый: атака на случайные белки
мотивы клики –много в графах белок-белковых взаимодействий (масс-спек. анализ комплексов – по определению) подграфы фиксированной структуры, встречающиеся существенно чаще, чем в случайном графе (с теми же свойствами)
Graphlets / motifs Przulj
Регуляторный каскад R – транскрипционная регуляция Х – ко-экспрессия
R – транскрипционная регуляция Р – белок-белковое взаимодействие Н – гомология ?
Субъединицы факторов транскрипции R – транскрипционная регуляция Р – белок-белковое взаимодействие Н – гомология
R – транскрипционная регуляция Р – белок-белковое взаимодействие Х – ко-экспрессия Н – гомология ?
Регулоны R – транскрипционная регуляция Р – белок-белковое взаимодействие Х – ко-экспрессия Н – гомология
Р – белок-белковое взаимодействие Х – ко-экспрессия ?
Ко-экспрессия в комплексах Р – белок-белковое взаимодействие Х – ко-экспрессия
S – синтетические летали (слабость) Н – гомология ?
Взаимозаменяемость паралогов (?) S – синтетические летали (слабость) Н – гомология
Четверные мотивы: взаимозаменяемость
Почти все bi-fan мотивы связаны друг с другом Регуляция транскрипции в E.coli
Прямые петли (Feed-forward loops) Продолжающийся ответ после снятия стимула Немонотонный ответ Ответ на увеличение стимула (в разы), независимо от начального уровня Динамический ответ
Метаболизм сахаров в E. coli Uri Alon
Ответ зависит от цАМФ (глюкоза) и сахара Uri Alon
Разложение на две функции ответа Uri Alon
Немонотонный ответ Uri Alon
Модули – существуют ли они? Клики в графе белок-белковых взаимодействий – комплексы (по построению) Много алгоритмов для поиска плотных подграфов. Вычислительные и содержательные сложности Если хабы слабо связаны друг с другом, естественный модель – звезда с центром в хабе
Модули в сети регуляции транскрипции Заходящие и выходящие степени не коррелируют Сильная негативная корреляция между выходящей степенью фактора и заходящей степенью регулируемого белка –Глобальные регуляторы действуют на гены, на которые мало кто действует Потому большие регуляторные модули слабо взаимодействуют друг с другом Maslov S, Sneppen K.
Стратификация сигнальных путей (человек) Ребра, ведущие назад (красные) – дефосфорилирование, убиквинизация – перезарядка сети EGRF1 B-cell Маслов-Исполатов
Человек: 732 белков (71 рецептор), 1671 взаимодействий (фосфорилирование, дефосфорилирование, гидролиз, и т.п.) 208 «обратных» связей Маслов-Исполатов
Модульность метаболической сети отражает стиль жизни бактерий Q = s [l s /L – (d s /2L) 2 ] max s номер модуля, s = 1 … K l s количество ребер в модуле L количество ребер в графе d s сумма степеней вершин модуля Мотивировка: минимизировать количество ребер между модулями (весь граф как модуль даст Q=0; для К несвязанных клик Q~1–1/К)
Obligate / Specialized / Aquatic / Facultative / Multiple / Terrestial Доля факторов транскрипции Размер гигантской компоненты Kashtan - Alon
Модульность Kashtan - Alon
Функциональная однородность модулей Buchnera aphidicola Escherichia coli Kashtan - Alon
Пример: параллельный синтез пуринов и пиримидинов уменьшает модульность Kashtan - Alon
Динамика в сети белок-белковых взаимодействий Увеличение концентрации белка влияет на концентрации других белков –Сеть: дрожжи, эксперимент –Концентрации белков – эксперимент –Константа диссоциации – одна на всех –Удвоим концентрацию одного белка и посмотрим, что получится Обычно возмущение не распространяется далеко (экспоненциальный спад) –Поэтому модули имеют смысл, несмотря на высокую связность сети Маслов-Исполатов
Распространение возмущений доля белков с изменением концентрации >20% как функция расстояния до измененного белка (для разных констант диссоциации)
примеры чередование уменьшения (красный) и увеличения (зеленый) концентраций Маслов-Исполатов
эволюция rich get richer (preferential attachment) –Internet, линии электропередачи Дупликации – зависит от начального графа случайные рождения/исчезновение ребер
Прибежали в избу дети, Второпях зовут отца: «Тятя! тятя! наши сети Притащили мертвеца». А.С.Пушкин