Системная биология – сети М.Гельфанд «Сравнительная геномика» Би Би 4 курс, ШБ 2 год, ПФУ(КГУ) весна 2014.

Презентация:



Advertisements
Похожие презентации
Развитие цветка резухи Таля двойная кластеризац ия – на генах и на условиях.
Advertisements

Системная биология – сети М.Гельфанд «Сравнительная геномика» БиБи 4 курс.
Системная биология - модели М.Гельфанд «Сравнительная геномика» БиБи 4 курс.
Мутантные формы люциферазы светляков с пониженной pH-чувствительностью спектров биолюминесценции Михаил Кокшаров, Наталья Угарова Кафедра химической энзимологии.
Безмасштабные сети (scale-free networks) Валерий Петрунин
Эволюция геномов М.Гельфанд «Сравнительная геномика» БиБи 4 курс.
Алгоритмы сканирования и обхода Лекция 3. Алгоритм сканирования графа Input: Орграф (граф) G и вершина s. Output: Множество R вершин, достижимых из s,
Графы Лекция 2. Графы Неориентированным графом (графом) называется тройка (V, E, ), где V и E конечные множества и {X V : | X | = 2}. Ориентированным.
Microarray gene expression profiling analysis combined with bioinformatics in multiple sclerosis К. Федоров.
M-чередующаяся декомпозиция Лекция 10. Нечетная декомпозиция Теорема 9.7 (Lovász [1972] ) Граф является фактор-критическим тогда и только тогда, когда.
2. Комплексы биополимеров с лигандами. Специфические взаимодействия. Методы определения констант равновесия Физико-химические основы биокатализа в иллюстрациях.
3. РЕГУЛЯЦИЯ. Размеры геномов Бактерии: – (~3 мм) –Escherichia coli: Дрожжи: – Drosophila: Растения:
Software Cloud Services О том, как Computer Science нам жить помогает или современные приложения теории графов Калачёв Максим Александрович Разработчик.
Биоинформатика: биологические тексты М.С.Гельфанд 29 октября 2006 Первый фестиваль науки МГУ Факультет биоинженерии и биоинформатики.
Принципы создания фреймовой системы обучения переводу на материале английских математических текстов Выполнила: Михайлова Светлана Валерьевна.
Заглавие Статистическое моделирование в задачах регионального переноса атмосферных примесей.
Определение космологических параметров H, q, j и s. Фотометрическое расстояние: Разложение в ряд Тейлора фотометрического расстояния: Параметр замедления.
Выполнила: Саввина Мария, студентка 2 курса СВФУ МИ ЛД-201/2.
Прокариоты: инициация и регуляция транскрипции. РНК-полимераза Главный компонент (core-фермент) σ-фактор Элонгация Распознавание промотора β β α ω α 12.
Анализ вычислительной сложности алгоритмов Теория сложности вычислений.
Транксрипт:

Системная биология – сети М.Гельфанд «Сравнительная геномика» Би Би 4 курс, ШБ 2 год, ПФУ(КГУ) весна 2014

разные сети метаболические регуляторные сети (фактор-ген) белок-белковые взаимодействия синтетические летали …

свойства сетей N = количество вершин распределение степеней вершин P(k) = вероятность того, что у случайно взятой вершины будет k ребер средняя длина пути между вершинами L

случайная сеть пуассоновское распределение P(k) = exp(-λ) λ k / k! Теорема Эрдеша-Реньи: фазовый переход – возникновение гигантской компоненты средняя длина пути ~ log N

scale-free network (сеть, свободная от масштаба) P(k) ~ k –γ γ>3 – ничего особенного 2

Случайные и scale-free графы: P(k) (линейная и лог. шкалы)

Коэффи- циент кластеризации Мера связи между соседями данной вершины

Метаболическая сеть с птичьего полета

В деталях

Один путь (метаболизм аргинина и пролина)

Ранг vs. степень вершины для метаболитов и реакций в H. pylori

Transcription regulatory network in bakers yeast Downloaded from the YPD database: 1276 regulations among 682 proteins by 125 transcription factors (10 regulated genes per TF) Part of a bigger genetic regulatory network of 1772 regulations among 908 proteins Positive to negative ratio 3:1 Broader distribution of out-degrees (up to 72) and more narrow of in- degrees (up to 21)

регуляция транскрипции (дрожжи, ChIP-chip) A: in-degree (относительно регулируемых генов): гистограмма (в полулогарифмических координатах) количества промоторов с заданным числом регуляторов– экспоненциальное распределение (у большинства генов мало регуляторов). Пустые кружки – случайный граф В: out-degree (относительно факторов): гистограмма количества факторов, связывающих заданное количество промоторов – scale-free

Transcription regulatory network in Homo sapiens Data courtesy of Ariadne Genomics obtained from the literature search: 1449 regulations among 689 proteins Positive to negative ratio is 3:1 (again!) Broader distribution of out-degrees (up to 95) and more narrow of in-degrees (up to 40)

Transcription regulatory network in E. coli Data (courtesy of Uri Alon) was curated from the Regulon database: 606 interactions between 424 operons (by 116 TFs) Positive to negative ratio is 3:2 (different from eukaryots!) Broader distribution of out-degrees (up to 85) and more narrow of in-degrees (only up to 6 !)

Yeast protein interaction network Data from the high- throughput two-hybrid experiment (T. Ito, et al. PNAS (2001) ) The full set containing 4549 interactions among 3278 yeast proteins 87% nodes in the largest component The highest connected protein interacts with 285 others! Figure shows only nuclear proteins

Гигантская компонента в графе белок- белковых взаимодействий в дрожжах Красный – летальная мутация Оранжевый – медленный рост Желтый – неизвестно Зеленый – не летальная мутация

Белок-белковые взаимодействия в дрожжах: P(k) и размеры связных компонент

Синтети- ческие летали в дрожжах

Предостережения Экспериментальный шум (узлы и ребра) –Пропуски (не удается экспрессировать) –Лишнее (липкие белки, комплексы) Дискретизация Динамика, специфичность –время Клеточный цикл Условия –место Компартменты Ткани

Что смотрят Биологическая интерпретация положения белка/гена в сети Глобальные топологические свойства сетей Интересные подсети –«графушки», модули Эволюция –Моделирование –Сравнительный анализ (пока почти нет)

Глобальные свойства сетей Свобода от масштаба / степенное распределение – ой ли? Khanin R, Wit E. How scale-free are biological networks (J Comput Biol. 2006): … Here we study 10 published datasets of various biological interactions and perform goodness-of-fit tests to determine whether the given data is drawn from the power-law distribution. Our analysis did not identify a single interaction network that has a nonzero probability of being drawn from the power-law distribution.

зависимость физиологических и геномных свойств от топологии дрожжи: –~10% genes with 60% genes with >15 links are essential гены с большим числом связей –с большей вероятностью имеют ортологов в многоклеточных эукариотах –ближе к ортологам из C. elegans

Пьянки и свиданки Бимодальное распределение корреляций уровня экспрессии –Красный: hubs –Голубой: non-hubs –Черный: случайный граф Party hubs: сам и соседи ко-экспрессируются (комплексы) Date hub: нет корреляции в уровнях экспрессии (сигнальные пути)

Устойчивость к атаке (распадение гигантской компоненты) основа сети – party hubs Красный: атака на party hubs Коричневый: атака на все хабы Голубой: атака на date hubs Зеленый: атака на случайные белки

мотивы клики –много в графах белок-белковых взаимодействий (масс-спек. анализ комплексов – по определению) подграфы фиксированной структуры, встречающиеся существенно чаще, чем в случайном графе (с теми же свойствами)

Graphlets / motifs Przulj

Регуляторный каскад R – транскрипционная регуляция Х – ко-экспрессия

R – транскрипционная регуляция Р – белок-белковое взаимодействие Н – гомология ?

Субъединицы факторов транскрипции R – транскрипционная регуляция Р – белок-белковое взаимодействие Н – гомология

R – транскрипционная регуляция Р – белок-белковое взаимодействие Х – ко-экспрессия Н – гомология ?

Регулоны R – транскрипционная регуляция Р – белок-белковое взаимодействие Х – ко-экспрессия Н – гомология

Р – белок-белковое взаимодействие Х – ко-экспрессия ?

Ко-экспрессия в комплексах Р – белок-белковое взаимодействие Х – ко-экспрессия

S – синтетические летали (слабость) Н – гомология ?

Взаимозаменяемость паралогов (?) S – синтетические летали (слабость) Н – гомология

Четверные мотивы: взаимозаменяемость

Почти все bi-fan мотивы связаны друг с другом Регуляция транскрипции в E.coli

Прямые петли (Feed-forward loops) Продолжающийся ответ после снятия стимула Немонотонный ответ Ответ на увеличение стимула (в разы), независимо от начального уровня Динамический ответ

Метаболизм сахаров в E. coli Uri Alon

Ответ зависит от цАМФ (глюкоза) и сахара Uri Alon

Разложение на две функции ответа Uri Alon

Немонотонный ответ Uri Alon

Модули – существуют ли они? Клики в графе белок-белковых взаимодействий – комплексы (по построению) Много алгоритмов для поиска плотных подграфов. Вычислительные и содержательные сложности Если хабы слабо связаны друг с другом, естественный модель – звезда с центром в хабе

Модули в сети регуляции транскрипции Заходящие и выходящие степени не коррелируют Сильная негативная корреляция между выходящей степенью фактора и заходящей степенью регулируемого белка –Глобальные регуляторы действуют на гены, на которые мало кто действует Потому большие регуляторные модули слабо взаимодействуют друг с другом Maslov S, Sneppen K.

Стратификация сигнальных путей (человек) Ребра, ведущие назад (красные) – дефосфорилирование, убиквинизация – перезарядка сети EGRF1 B-cell Маслов-Исполатов

Человек: 732 белков (71 рецептор), 1671 взаимодействий (фосфорилирование, дефосфорилирование, гидролиз, и т.п.) 208 «обратных» связей Маслов-Исполатов

Модульность метаболической сети отражает стиль жизни бактерий Q = s [l s /L – (d s /2L) 2 ] max s номер модуля, s = 1 … K l s количество ребер в модуле L количество ребер в графе d s сумма степеней вершин модуля Мотивировка: минимизировать количество ребер между модулями (весь граф как модуль даст Q=0; для К несвязанных клик Q~1–1/К)

Obligate / Specialized / Aquatic / Facultative / Multiple / Terrestial Доля факторов транскрипции Размер гигантской компоненты Kashtan - Alon

Модульность Kashtan - Alon

Функциональная однородность модулей Buchnera aphidicola Escherichia coli Kashtan - Alon

Пример: параллельный синтез пуринов и пиримидинов уменьшает модульность Kashtan - Alon

Динамика в сети белок-белковых взаимодействий Увеличение концентрации белка влияет на концентрации других белков –Сеть: дрожжи, эксперимент –Концентрации белков – эксперимент –Константа диссоциации – одна на всех –Удвоим концентрацию одного белка и посмотрим, что получится Обычно возмущение не распространяется далеко (экспоненциальный спад) –Поэтому модули имеют смысл, несмотря на высокую связность сети Маслов-Исполатов

Распространение возмущений доля белков с изменением концентрации >20% как функция расстояния до измененного белка (для разных констант диссоциации)

примеры чередование уменьшения (красный) и увеличения (зеленый) концентраций Маслов-Исполатов

эволюция rich get richer (preferential attachment) –Internet, линии электропередачи Дупликации – зависит от начального графа случайные рождения/исчезновение ребер

Прибежали в избу дети, Второпях зовут отца: «Тятя! тятя! наши сети Притащили мертвеца». А.С.Пушкин