Ген-ориентированные базы данных и геномные браузеры Что такое ген-ориентированные базы данных? Самые простые примеры таких БД Примеры геном-ориентированных баз данных и геномные браузеры Human Genome Browser
Что такое ген-ориентированные базы данных? Единица исследования – ген (а не экспериментальная последовательность) Призваны снабжать информацией по конкретному гену, а непоследовательностям, относящимся ко данному конкретному гену – интегрируют все такие части в единое целое за Вас
Первый пример – Gene Entrez (бывший LocusLink) в NCBI Единица – генетический локус – конкретное место на хромосоме, кодирующее данный белок и/или соответствующее данному гену
DUT ген человека
Продолжение записи: Bibliography –Related Articles in PubMed –GeneRIFs: Gene References Into Function Interactions General gene information –Markers –Genotypes –Pathways –Homology GeneOntology General protein information (Names, ECs, ACs) NCBI Reference Sequences (RefSeq) –mRNAs and proteins –Reference assembly + Alternate assembly: Genomic Related Sequences (links between ACs of different types) Additional Links (OMIM, PharmGKB, HRDP, UniGene)
MapViewer
Геномные базы данных Объект – полный геном Возможность одновременно изучать все гены одного генома Сравнение друг с другом целых геномов – сравнительная геномика (comparative genomics) Интеграция всей доступной информации о данном геноме Основная информация о генах, но в геномном контексте Геномные браузеры – графическое представление всей интегрированной информации NCBI -> Genomic Biology (
Вирусные геномы Под таблицей – поиск (точное название генома или любого другого уровня таксономии)
HIV2 геном
Sequence Viewer
Protein coding genes link
gMap (comparative genomics) Zoom in, zoom- out Выбрать подмножество геномов Или кластер (!) Графическая схема в каждом окне своя!
Бактериальные геномы на сайте NCBI Tools legend: T - TaxMap; P - ProtTable; C - COG Table; D - 3-D neighbors; L - BLAST; S - CDD search; G - GenePlot; X - TaxPlot; M - gMap; F - FTP; R - Publications
COG Table
COG Table – регион (Overview)
TaxMap Каждая точка – ген Положение – слева направо, сверх вниз Цвет соответствует таксону лучшего BLAST-хита Только выше выставленного порога Распределение всех бласт хитов – нижняя диаграмма Click на точку – список бласт хитов к сегменту
Genomes in progress
TIGR Comprehensive Microbial Resources Стратегия – от инструмента, а не от генома scripts/CMR/CmrHomePage.cgi
Все геномы на TIGR
Эукариоты NCBI – Map Viewer, FTP для полной последовательности, таксономические группы, ссылки на специализированные базы данных MapViewer – подобно LocusLink
Human Два основных браузера: Ensembl ( – EBI & Sanger Institute, использует свои IDs, 35 эукариотических видов Human Genome Browser ( – UCSC, USAhttp://genome.ucsc.edu/ использует GenBank IDs, 41 эукариотический вид
Ensembl Ensembl Tutorials and Worked Examples:
Human Genome Browser RefSeq ID Chr Band Gene name Coords
DUT gene (dUTPAse)
Анализ RefSeq трека
Provided tracks (types)
Custom Track Возможность визуализировать свою собственную аннотацию: места локализации каких-либо своих свойств Upload – в BED, GFF, GTF, WIG или PSL формате: Напр., chr name11+ chr name21+ chr name31-
Как это выглядит?
BLAT BLAT = BLAST с параметрами, оптимизированны ми на поиск локализации последовательно- стей в родном геноме
Table Browser