Использование информационных технологий для характеристики геномов в биотехнологических исследованиях Докладчик: магистрант кафедры микробиологии Демидович Е.Г. Специальность: Биология Минск, 2015
Автоматические анализаторы (ИФА- диагностика); Статистическая обработка данных в биологических исследованиях; Удаленные ресурсы (анализ геномов, транскриптонов и протеомов); Биометрия и биоинформатика. Использование информационных технологий в биологии:
Конкретный пример использования информационных технологий для анализы генетической последовательности неизвестного организма с помощью ресурсов удаленного доступа. Общая характеристика работы
Селективный отбор новых штаммов микроорганизмов; Выделение ДНК; Секвенирование ДНК. Опорным пунктом данной работы являлась последовательность нуклеотидов вида CAGCgAGAtAGGCG…………. Подготовительный материал
Использовался удаленный ресурс BLAST ( Данный фрагмент ДНК принадлежит организму Bacteroides fragilis YCH46, с идентичностью 100%, Е value равным 0.0. Bacteroides fragilis - грамотрицательные анаэробные палочковидные бактерии, являются представителями нормальной микрофлоры кишечника. Аннотация генома
По данным, представленным на графике абсолютное большинство белков имеет размер от 50 до 550 аминокислот, что соотносится со средней длиной бактериального гена (1050 нуклеотидов / 3 = 350 аминокислот). Автоматическая аннотация График 1 - Размер белков в геноме.
Автоматическая аннотация Определяется аминокислотный состав по его записи на NCBI. По данным, представленным на графике, можно судить что, горазда чаще среднего в белках этого организма встречаются лейцин (L), аланин (А), глицин (G), изолейцин (I), а реже всего цистеин (С), триптофан (W) и гистидин (H). График 2 - Аминокислотный состав продуктов генома
Наиболее полно описаны гены, отвечающие за общие клеточные процессы (репликация, транскрипция, трансляция, выработка энергии, транспорт и метаболизм аминокислот), а гены, участвующие в более частных процессах (клеточное деление, посттрансляционная модификация белков, синтез вторичных метаболитов и трансдукция сигналов) изучены куда слабее. Автоматическая аннотация Рисунок 1- Функции белков.
А) Поиск иРНК Использовался удаленный ресурс В геноме обнаружено 3 гена, кодирующих иРНК. Б) Поиск тРНК Поиск производили при помощи программы WebMGA. По результатам программы обнаружено 54 гена различных тРНК. Некоторые из генов были расположены близко друг от друга, возможно, что они находились в единых оперонах. В) Поиск профагов Поиск осуществляли с помощью программы: PHAST. Ручная аннотация
Программа обнаружила, что в геном входят 2 профага. Причем один был определен как интактный. Рисунок 2 - Интактный профаг
Второй профаг определился как сомнительный Рисунок 3 - Сомнительный профаг
Был найден 1 CRISPR-повтор длиной 608 нуклеотидов, имеющий 9 специфических спейсерных участков, разделенных повтором длиной 30 нуклеотидов. (ATTTCAATTCCATAAGGTACAATTAATACC) РУЧНАЯ АННОТАЦИЯ Г) CRISPR-повторы. CRISPR-повторы искали при помощи поискового сервера: psud.fr/Server/CRISPRfinder.phphttp://crispr.u- psud.fr/Server/CRISPRfinder.php
Кольцевая карта полученного генома была построена с помощью программ Артемис и DNAploter. Содержит 8 кругов: ОРС + нити, ОРС – нити, иРНК, тРНК, профаги, повторы, GC-состав и GC-перекос (от внешнего кольца к внутреннему). Построение кольцевой карты Рисунок 4 - Кольцевая карта.
А) GC-состав GC-состав изображен в виде кольцевой карты, в которой указано отклонение содержание G+C от среднего, который для Bactroides составляет %. GC-состав сильно варьирует только в одном расположенном в районе нуклеотида. Причина возникновения такого пика является участок, сильно богатый GC. Б) GC-перекос У прокариот существует асимметрия в содержании нуклеотидов на лидирующей и запаздывающей цепях. Лидирующая цепь богата G и T, а запаздывающая – C и А. GС-перекос показывает следующее: ГЦ-перекос =(Г - Ц)/(Г + Ц) Исходя из такого графика в месте, где положительные значения меняются на отрицательные, находится точка начала репликации ori. Построение кольцевой карты
ГИСТИДИН КИНАЗА (ГК) А ) Физико-химические свойства. Физико-химические характеристики были получены с помощью ресурса bin/protparam/protparam: bin/protparam/protparam Число аминокислот: 610; Молекулярная масса: ; Теоритическое pI: 6.36 Аминокислотный состав: Ala (A) 4.3%, Leu (L) 11.5%, Val (V) 6.4%, Glu (E) 8.5%, Ile (I) 8.5%, Ser (S) 6.4%, Gly (G) 4.4%, Arg (R) 5.1%, Gln (Q) 4.4%, и т.д. Число отрицательно заряженных остатков (Asp + Glu): 77 Число положительно заряженных остатков (Arg + Lys): 72 Предположительное время полужизни возможных продуктов: 30 часов (mammalianreticulocytes, invitro). >20 часов (yeast, in vivo). >10 часов(Escherichia coli, in vivo). РЕГУЛЯТОР ОТВЕТА (РО) Число аминокислот: 247; Молекулярная масса: ; Теоритическое pI: 4.95 Аминокислотный состав: Ala (A) 5.3%, Leu (L) 10.5%, Val (V) 6.9%, Glu (E) 9.7%, Ile (I) 8.1%, Ser (S) 6.1%, Gly (G) 4.5%, Arg (R) 6.1%, Gln (Q) 1.6%, и т.д. Число отрицательно заряженных остатков (Asp + Glu): 44 Число положительно заряженных остатков (Arg + Lys): 35 Предположительное время полужизни возможных продуктов: 7.2 часов (mammalianreticulocytes, invitro). >20 часов (yeast, in vivo). >10 часов(Escherichia coli, in vivo). Характеристика 2-х компонентной системы регуляции
Б) Локализация Для определения локализации белков в клетке использовался удаленный ресурс PSORTb ( ) Результаты: ГК находится в цитоплазматической мембране. РО находится в цитоплазме. Характеристика 2-х компонентной системы регуляции
В) Вторичная структура ГК Вторичную структуру определяли при помощи ресурса bin/secpred_sopma.pl. bin/secpred_sopma.pl Из полученных результатов видно : Альфа-спираль (Hh) : 54.10% β-складчатый слой(Ee) : 16.89% Бета поворот (Tt) : 5.74% Неупорядоченная структура (Cc) :23.28% Рисунок 5 - Распределение вторичных структур в белке.(ГК)
В) Вторичная структура РО Альфа-спираль (Hh) : 54.10% β-складчатый слой(Ee) : 24.89% Бета поворот (Tt) : 5.74% Неупорядоченная структура (Cc) :27.51% Рисунок 6 - Распределение вторичных структур в белке (РО)
Г) Поиск функциональных доменов ГК Для того, чтобы установить принадлежность белка к определённому семейству, функциональной активности использовали ресурс: heidelberg.de/smart/. heidelberg.de/smart/ В результате было установлено наличия 2 функциональных доменов и 2 структурных мотивов. Рисунок 7 - Функциональные домены. (ГК)
Г) Поиск функциональных доменов РО Для того, чтобы установить принадлежность белка к определённому семейству, функциональной активности использовали ресурс: heidelberg.de/smart/, и heidelberg.de/smart/ В результате было установлено наличия 2 функциональных доменов Рисунок 8 - Функциональные домены.(РО)
Д) Третичная структура белка. (ГК) Третичную структуру определяли на основании гомологии с помощью ресурса Программа показала 50 возможных гомологов, на основании структуры которых можно было построить модель. Выбрали наиболее лучший результат. Рисунок 9 - Трёхмерная модель белка.(ГК)
Д) Третичная структура белка. (РО) Третичную структуру определяли на основании гомологии с помощью ресурса Программа показала 50 возможных гомологов, на основании структуры которых можно было построить модель. Выбрали наиболее лучший результат. Рисунок 10 - Трёхмерная модель белка. (РО)
Для построения филогенетического дерева был использован пакет программ МЕГА, в котором деревья могут быть построены по различным алгоритмам. Было построено 1 дерево, с помощью алгоритма UPGMА. Результаты: Построение филогенетического дерева Рисунок 11 - Филогенетическое дерево.
Праймеры были сконструированы вручную. Все сконструированные праймеры проверялись на наличие вторичных структур и на соответствие матрице через ресурс Результат: (ГК) forward - CTACCTCTCCTTAGCCAGGGTGAATAC -L Tm - 60 °С - GC - 52% reverse - GTGAGACTCCTGTTACTCTGTGGTG -L Tm - 61 °С -GC - 52% Параметры ПЦР: Плавление: Двухцепочечную ДНК-матрицу нагревают до 98°C на 0,52 мин, чтобы цепи ДНК разошлись. Отжиг: Отжиг проводится при температуре на 5 градусов меньше Tm, т.е. отжиг производится при 55°C. Элонгация: Элонгация проводится с помощью taq-полимеразы, при 72°C в течении 1 минуты 50 секунд (длина последовательности 1832 нуклеотида). Определение характеристик ПЦР
Праймеры были сконструированы вручную. Все сконструированные праймеры проверялись на наличие вторичных структур и на соответствие матрице через ресурс Результат (РО) forward - CTATTCCGTTTCGAAGCAATAACC -L Tm - 60 °С - GC - 60% reverse - ATGAACGACTGCCGTATTTTAGTG -L Tm - 60 °С -GC - 60% Параметры ПЦР: Плавление: Двухцепочечную ДНК-матрицу нагревают до 98°C на 0,52 мин, чтобы цепи ДНК разошлись. Отжиг: Отжиг проводится при температуре на 5 градусов меньше Tm, т.е. отжиг производится при 55°C. Элонгация: Элонгация проводится с помощью taq-полимеразы, при 72°C в течении 41 секунды (длина последовательности 689 нуклеотидов). Определение характеристик ПЦР
В данной работе ярко была представлена работы в такой области знаний, как биоинформатика. Подобные работы действительно существуют и используются исследователями для дальнейшей работы в области геномики и молекулярной биологии, что является подспорьем для получения продуктов биотехнологии и исследований в этой области. Заключение
Спасибо за внимание!