Браузер для генома п. Лисий Нос 7 ноября 2013 Симонов Сергей Александрович к.ф.-м.н. Центр Геномной Биоинформатики им Ф. Добржанского, СпБГУ
Карта современной науки (РР ноябрь 2013)
План Биоинформатика Геном – протеом Элементы генома Визуализация генома
Биоинформатика
10 12 клеток В каждой клетке – Геном длиной 3.2*10 9
Азбука Морзе
Коды Хаффмена (префиксные)
A=1, C=2, G=3, T=4
a 1 x 1 +a 2 x 2 +…a n x n =b, n=3.2*10 9
A=A(до); c=B(ре); g=C(ми); t=D(фа) 15
Зачем? Не знаешь функцию – изучай структуру
Примеры элементов в геноме Повторы 50% Гены 1-4% Экзоны Интроны Эндоретровирусы 0.0… % SNP, SNV, Metilated site … 0.00… %
Как «читают» геном? Берут образец Выделяют ДНК Режут на фрагменты Секвенируют, получая риды (reads) Сибирают риды в контиги, скафолды, хромосомы, геном
Есть исходный геном (reference) Что в нем можно закодировать? 4 типа нуклеотида 20 аминокислот Генетический код основан на триплетах – т.н. Кодонах Есть Старт-кодон и три стоп кодона.
Т.о. Можно видеть, что код неоднозначный. То же самое для большинства геномных элементов – «похоже», но не тождественно! Около белков в базе данных.
Как сравнивать последовательности? Локально. Алгоритм Смита-Ватермана. Динамическое программирование Глобально. Алгоритм Нудельмана-Вунша Эвристика - БЛАСТ
Сколько вычислений? 10 9 мега гига пета экса Производительность суперкомпьютеров на уровне пета. К 2016 ожидается превышение экса
Вирусы
Структура вируса
Итак. С помощью алгоритмов выравнивания можно находить: Повторы Белки Вирусы СНИПы Другие элементы
Несколько ссылок про геномные элементы огромная база данных с генетической информацией - открытый для всех геномный браузер - мой геномный браузер
Как увидеть цельную картину и сохранить возможность пристального взгляда? Браузер – как средство «поглазеть»… Посмотреть в интернете (IE, FireFox, Chrome, Safari, etc Увидеть геном (NCBI, Ensembl, UCSC, Gbrowse, Jbrowse etc).
СПАСИБО Симонов Сергей Александрович к.ф.-м.н. Центр Геномной Биоинформатики им Ф. Добржанского, СпБГУ