NGS И ЕГО ПРИМЕНЕНИЕ В РАЗЛИЧНЫХ ОБЛАСТЯХ БИОЛОГИЧЕСКОЙ НАУКИ Мария Логачева
Технологии секвенирования Sanger sequencing 2-е поколение 3-е поколение 1-е поколение
Общая схема работы NGS: от исходной ДНК до «букв» на экране приготовление библиотеки (дробление ДНК и лигирование адаптеров) амплификация индивидуальных фрагментов и отжиг праймеров синтез цепи, комплементарной секвенируемому фрагменту регистрация сигнала интеграция сигнала, перевод в последовательность ДНК (basecalling)
Высокопроизводительное пиросеквенирование (454): принцип метода Самая первая из технологий NGS (Margulies et al. Nature 2005; )
454 – принцип метода Через лунки в заданном порядке пропускают реагенты (dNTP, люциферин, аденозинфосфосульфат) При присоединении dNTP выделяется пирофосфат. Сульфурилаза преобразует пирофосфат + аденозинфосфосульфат в АТФ. АТФ используется для окисления люциферина люциферазой. Световой сигнал регистрируется фотокамерой.
Технологии секвенирования 2 поколения: 454 платформаGS JuniorGS FLX длина чтения число чтений, М0.11 объем данных 35 Мб 700 Мб цена за запуск/ цена за Мб (в $) 1 100/ /7 время работы 10 часов 24 часа частота и тип ошибок 1% (индели) Преимущества: большая длина чтения (сравнимо с секвенированием по Сэнгеру) короткое время работы наименее чувствительна к GC-составу Недостатки неточность прочтения гомополимерных участков высокая цена в расчете на нуклеотид в 2016 году прекращается поддержка
Секвенирование Illumina: принцип метода 1. ДНК фрагментируют и присоединяют к фрагментам адаптеры 2. ДНК пропускают через каналы ячейки, покрытые праймерами, комплементарными концам адаптеров 3. Через ячейку пропускают реагенты для достраивания второй цепи ДНК 4. Двуцепочечные фрагменты денатурируют Стадии 3-4 повторяются раз 6. Каждый фрагмент оказывается окружен группой идентичных молекул («кластеры»).
Секвенирование Illumina - принцип метода 7. Через ячейку пропускают реагенты (флуоресцентно меченые терминированные dNTP и полимеразу) 8. На ячейку светят лазером и проводят съемку. 9. Через ячейку пропускают реагенты, отщепляющие флуорофор и терминатор 10. Повторение 7-9 нужное число раз ( ). Число циклов соответствует длине чтения.
Illumina – приборы Самая распространенная из технологий NGS (~ 80% всех данных) платформаHiSeq2000HiSeq2500MiSeq длина чтения число чтений, М объем данных, Гб цена за запуск/цена за Мб (в $) / / /0.14 частота и тип ошибок 0.1% (замены) % (замены) время работы 6 дней 40 часов 65 часов HiSeq2000 и HiSeq2500 – модификации одного и того же прибора. MiSeq существует также в варианте MiSeqDx – первый NGS-прибор, разрешенный для использования в диагностике. В начале 2014 г. появились два новых прибора – NextSeq500 и HiSeqX 10
Преимущества: высокая точность универсальность доступность ПО для обработки и анализа результатов наименьшая цена получаемых данных (в расчете на нуклеотид) Недостатки высокая цена реагентов проблемы с секвенированием матриц с низкой сложностью большая длительность прогона ошибки в GC-богатых участках Illumina – преимущества и недостатки
Полупроводниковое секвенирование Сходно с 454-секвенированием, но регистрируется не свет, а pH Самая новая из технологий секвенирования 2 поколения Преимущества: относительно низкая цена за запуск быстрота Недостатки невысокая точность прочтения гомополимерных участков низкая производительность платформаIon TorrentIon Proton длина чтения до число чтений, М объем данных 2 Гб Гб цена за запуск/цена за Мб (в $) 939/ /0.02 частота и тип ошибок % время работы 7 часов при длине часа
Секвенирование путем лигирования (SOLiD) платформаSolid 5500 длина чтения 75+35, число чтений, М>1 400 объем данных 150 Гб цена за запуск/цена за Мб (в $)10 503/0.07 время работы 8 дней Преимущества: высокая точность возможность использовать часть дорожек на ячейке Недостатки очень короткие чтения длительность работы относительно малая доступность свободного ПО
Секвенирование единичных молекул Helicos простая пробоподготовка - фрагментация ДНК и аденилирование фрагментов. Затем фрагменты закрепляются на ячейке с олиго-dT принцип секвенирования сходен с Illumina – используются флуоресцентно меченые обратимо терминированные нуклеотиды (один тип нуклеотидов за цикл) небольшая (до 50 пн) длина чтения, много ошибок (3-5%) Область применения – высокоточный анализ экспрессии, оценка копийности участков генома
Секвенирование единичных молекул. Pacific Biosciences (SMRT sequencing) Используется полимераза, иммобилизованная в 100-нм лунках, и флуоресцентно меченые dNTP. Возможны очень длинные чтения (> ), но высокая частота ошибок (до 10%). Возможно прямое секвенирование метилированной ДНК, ведется работа над разработкой прямого секвенирования РНК. Области применения – де ново сборка (в сочетании с Illumina для коррекции ошибок), анализ ллизоформ, поиск модифицированных оснований
Секвенирование единичных молекул. Oxford Nanopore Принцип основан на использовании мембран с белковыми нанопорами, через которые протягивается молекула ДНК. Секвенатор размером с USB-диск. Высокая скорость, очень высокая частота ошибок, низкая производительность (пока!)
Области применения NGS What can next generation sequencing do for you? секвенирование геномов и транскриптонов de novo отправная точка большинства молекулярно-биологических и генетических исследований на немодельных объектах, поиск крупных геномных перестроек полногеномное секвенирование поиск мутаций, ассоциированных с болезнями, картирование генов, геномы отдельных типов клеток, анализ древней ДНК направленное секвенирование биомедицина: скрининг мутаций с известной ролью в развитии болезней и поиск новых мутаций анализ транскриптом сравнение уровней экспрессии, поиск новых генов и ллизоформ, аннотация de novo отсеквенированных геномов ДНК-белковые и ДНК-ДНКовые взаимодействия поиск сайтов связывания транскрипционных факторов, изучение пространственной организации хроматина метагеномика анализ разнообразия микробных сообществ
Секвенирование геномов de novo: Amborella
Анализ транскриптом: перенос РНК от хозяина к паразиту Kim et al. Genomic-scale exchange of mRNA between a parasitic plant and its hosts. Science (6198):
Технологии секвенирования 2 поколения: области применения платформа/задача 454Illumina Ion Torrent/Proton Solid секвенирование de novo для небольших геномов - полногеномное секвенирование для небольших геномов ++ направленное секвенирование + ампликоны анализ экспрессии для небольших задач ++ ДНК-белковые взаимодействия (ChIP-seq) и т.д для небольших задач ++ метагеномика анализ разнообразия микробных сообществ +++ особенно 16S +++ Miseq – 16S, Hiseq - полногеномное +-