Транскриптомика – как следует из ее названия – наука о транскриптоме. Транскриптомом называют совокупность всех транскриптов, которые синтезируются в одной клетке или группе клеток (в том числе мРНК и некодирующие РНК). Понятие «транскриптом» может обозначать полный набор транскриптов, синтезируемых в данном организме, или специфический набор транскриптов (молекул РНК), представленный в клетках определенного типа. Если геном у всех клеток одной линии, как правило, одинаков, то транскриптом может быть весьма изменчив и зависит от условий окружающей среды. Понятие «транскриптом» отражает профиль экспрессии генов в данный момент времени, поскольку включает в себя все транскрипты данной клетки. Понятие о транскриптоме и транскриптомике
Актуальность Цель транскриптомики – определение, описание механизмов регуляции экспрессии генов. Сегодня благодаря появлению и совершенствованию методов транскриптомики получен огромный массив данных о закономерностях контроля экспрессии генов в самых разных аспектах. Получена масштабная информация о влиянии различных факторов на активность генома. Появляется все больше информации о тканеспецифичных уровнях экспрессии всех генов во всех тканях человека и других животных.
Задачи транскриптомики Исследование структуры и динамики транскриптом, лежащих в основе формирования второго уровня фенотипа – протеома клеток, тканей и т.д., является задачей транскриптомики. Некоторые задачи транскриптомики в то же время являются также и задачами функциональной геномики – в той мере, в какой информация, необходимая для формирования структуры транскриптом, закодирована в геноме и может быть выявлена при его изучении. Задачи функциональной геномики, перекрывающиеся с задачами транскриптомики, заключаются в выявлении и исследовании условий для формирования характерной для клеток определенных типов структуры транскриптом, предопределенной генетическими программами развития, т.е. зашифрованными в геноме сигналами.
Собственные задачи транскриптомики состоят в выявлении и изучении не зависящих от геномных сигналов факторов, влияющих на формирование структуры и динамики транскриптом, и, в конечном счете, протеома. В целом, к задачам транскриптомики относятся: – выявление всех транскрипционных единиц, включая мРНК, некодирующие РНК и малые РНК; – анализ транскрипционной структуры генов - сайтов инициации транскрипции, 5- и 3-концов генов; – анализ паттернов сплайсинга и других посттранскрипционных модификаций.
Методы исследования транскриптом Существует несколько распространенных методов для широкомасштабного исследования транскриптом – «серийный анализ экспрессии генов» - Serial analysis of gene expression (SAGE), «прочитанные фрагменты экспрессированных последовательностей» - Expressed Sequence Tags (ESTs), «Массовое одновременное секвенирование характерных фрагментов» Massively Parallel Signature Sequencing (MPSS).
Метод ДНК Microarray (ДНК- микро матрицы) Одним из наиболее распространенных современных методов, позволяющих сравнивать транскриптомные профили, является метод ДНК Microarray (ДНК- микро матрицы), заключающийся в использовании фиксированных на твердом носителе (чипе) в определенном порядке большого числа строго определенных олигонуклеотидов, с которыми осуществляется взаимодействие (гибридизация) анализируемого пула кДНК. Поскольку на одном чипе можно поместить более тысячи различных олигонуклеотидных зондов (даже более ), это дает возможность анализировать одновременно уровень и паттерн большого количества кДНК. Далее профиль транскриптов анализируется с помощью кластерного анализа.
Серийный анализ генной экспрессии (SAGE). Другой современный подход, применяющийся для анализа уровня транскриптов большого количества генов, – серийный анализ генной экспрессии (SAGE). Его основные этапы - выделение тегов, соединение их в протяженные ряды и их массовое секвенирование. Полученные тексты обрабатывают компьютерными методами и с помощью подсчета коротких одинаковых последовательностей получают количественные данные о распределении транскриптов многих тысяч генов для разных образцов. Появление новых технологий секвенирования (NGS), основанных на детекции продуктов с помощью лигазной реакции (платформа Solid), при освобождении пирофосфата в ходе роста цепочки нуклеотидов (Roshe), флуоресценции меченого нуклеотида в результате синтеза нуклеотидной последовательности (платформа Illumina) позволили значительно упростить применение данного метода для исследования транскриптонов различных организмов.
Анализ прочитанных фрагментов экспрессированных последовательностей (EST). Другой современный метод оценки транскриптом различных организмов – анализ прочитанных фрагментов экспрессированных последовательностей (EST). Основные этапы метода заключаются в синтезе кДНК, однонаправленном клонировании, создании библиотеки кДНК-клонов, частичном секвенировании каждого клона с двух сторон - получении EST, кластеризации и выравнивании EST, генерировании консенсусов, реконструирующих структуру транскриптов. Чаще всего этот подход используется для создания ДНК-зондов, которые в дальнейшем используются для анализа уровня транскриптов генов методом Microarray.
Наиболее удачная и эффективная до недавнего времени техника – анализ на микрочипах. Но достижения технологий последних лет открывают новые горизонты транскриптомики, и в основном это связано с развитием второй ветви технологий транскриптомики – секвенирования.
Олигонуклеотидные микрочипы В 1988 г. группой ученых Института молекулярной биологии им. В.А. Энгельгардта РАН, руководимой А.Д. Мирзабековым, была инициирована разработка олигонуклеотидных микрочипов (microchip), иначе называемых олигонуклеотидными микро матрицами (microarray). Целью этого исследования была разработка метода, позволяющего секвенировать короткие фрагменты ДНК путем гибридизации с олигонуклеотидами известной последовательности, которые иммобилизованы на твердом носителе в строго определенном порядке (это и называется микро матрицей или микрочипом). В дальнейшем благодаря созданию специального оборудования удалось роботизировать процесс получения микрочипов с нанесением в строго определенном порядке микроколичеств олигонуклеотидов или фрагментов ДНК (кДНК) на твердый носитель (обычно используют стекло, нейлоновые мембраны, силиконовые поверхности и др.). Это позволило создавать микро матрицы, содержащие на поверхности в несколько квадратных сантиметров сотни и тысячи индивидуальных проб для последующей гибридизации. Препараты ДНК, предназначенные для гибридизации на микрочипе, флуоресцентно метят, обычно в процессе ПЦР. После гибридизации и отмывки микрочип анализируют с помощью лазерного сканера и данные флуоресценции каждой ячейки микро матрицы подвергают компьютерной обработке, используя специальное программное обеспечение.
Секвенирование многочисленных кДНК и полных геномов все расширяющегося спектра организмов создало базу для получения микрочипов, позволяющих одновременно изучать экспрессию большого числа генов на уровне целого генома. Современных метод исследования транскриптом – использование гибридизации кДНК с упорядоченными олигонуклеотидными зондами, организованными в виде биочипов высокой плотности (tiling arrays).
Плюсы и минусы биочиповых технологий В принципе, биочиповые технологии позволяют проводить до 109 индивидуальных гибридизаций на одном чипе и получать уникальную информацию об особенностях транскрипции больших геномов, в том числе, осуществлять картирование транскриптов с разрешением в несколько п.н. Несмотря на выдающиеся возможности биочиповых технологий, они не лишены ряда недостатков, среди которых необходимо отметить значительную стоимость индивидуальных экспериментов, необходимость знания последовательностей нуклеотидов анализируемого генома, высокий фон от неспецифических перекрестных гибридизаций, а также ограниченный диапазон количественных измерений уровней транскрипции генов, связанный с вышеупомянутым фоном и быстрым насыщением гибридизационного сигнала.
Новые инструменты транскриптомики: RNA-Seq Методология RNA-Seq (RNA sequencing) успешно конкурирует с биочиповыми технологиями в исследованиях транскриптом. Основное преимущество этого подхода заключается в непосредственном определении последовательностей нуклеотидов исследуемых кДНК высокопроизводительными методами NGS и прямом подсчете индивидуальных молекул кДНК в исследуемых образцах. RNA-Seq позволяет как картировать транскриптом, так и количественно оценивать уровни транскрипции индивидуальных участков генома.
Принцип RNA-Seq Принцип RNA-Seq заключается в глубоком секвенировании кДНК с добавленными адаптерами на одном или обоих концах кДНК. Секвенирование при RNA-Seq производится не по Сэнгеру, а с помощью секвенирования следующего поколения (NGS). Каждая молекула секвенируется (с амплификацией или без нее) с одного или двух концов на высокопроизводительных платформах. В результате секвенирования получаются риды (Рид (read) – короткая нуклеотидная последовательность) длиной нуклеотидов. Затем риды или выравниваются на рефренсном геноме или рефренсных транскриптах, или осуществляется сборка de novo без рефренсной последовательности. В результате получаются полно геномные транскрипционные карты, включающие качественные (в т.ч. структурные) и/или количественные характеристики экспрессии каждого гена.
Плюсы и минусы RNA-Seq Применение RNA-Seq-методов в функциональной транскриптомике, в принципе, не требует знания первичной структуры исследуемых геномов и позволяет выявлять структурные варианты (например, SNP) транскриптов. Кроме того, для этой группы методов, в отличие от биочиповых технологий, характерен очень низкий уровень фоновых сигналов. Основными же их недостатками являются артефакты, связанные с приготовлением библиотек кДНК и оставляющая желать лучшего эффективность методов биоинформатики, разработанных для анализа больших массивов данных.
Заключение В фундаментальном плане развитие техник транскриптомики позволяет лучше понять не только мир РНК и его особенности в клетках различных тканей и у разных организмов. Методы полного профилирования транскриптом позволили выявить (на сегодняшний день) у человека РНК, не кодирующих белок, а также качественное разнообразие транскрипции белок-кодирующих генов. Вся эта информация оказывается чрезвычайно важной для понимания молекулярной биологии клетки, так как именно на основе выявления методами транскриптомики читаемых участков ДНК делается вывод о закономерностях регуляции работы генома. В области биомедицины данные о закономерностях экспрессии генов используются для выявления нарушений течения клеточных процессов при патологиях. В последнее десятилетие транскриптомика широко применялась для изучения молекулярных основ развития огромного количества заболеваний, и транскриптомика оказывается эффективной для изучения групп патологий, для которых характерна высокая этиологическая гетерогенность при сходстве фенотипической манифестации.
СПАСИБО ЗА ВНИМАНИЕ.