Задача построения множественного выравнивания. Последовательности в Fasta формате (вход) >sw|P04252|BAHG-VITST Bacterial hemoglobin. MLDQQTINIIKATVPVLKEHGVTITTTFYKNLF.

Презентация:



Advertisements
Похожие презентации
Множественное выравнивание С.А.Спирин, весна
Advertisements

Множественное выравнивание С.А.Спирин, весна 2009.
Множественное выравнивание С.А.Спирин, весна 2011.
Студент группы МТ Уросов Александр Павлович Научный руководитель Авербух Владимир Лазаревич Доцент КИПУ Кандидат технических наук.
РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ МОДЕЛИРОВАНИЯ КОНКУРЕНТНОГО РЫНКА НА КЛАСТЕРНЫХ СИСТЕМАХ Авторы: Е.В. Болгова, А.С. Кириллов, Д.В. Леонов Научный.
Институт программных систем Российской академии наук1 Комплексная программа по оснащению ВУЗов и научных организаций высокопроизводительной вычислительной.
Что такое программирование? Совокупность процессов, связанных с разработкой программ и их реализацией. В широком смысле к указанным процессам относят все.
Решение задач биоинформатики при помощи веб - и интернет - сервисов.
Система моделирования муравьиных алгоритмов в грид: задача поиска последовательности мутаций между геномами Дырдина Анна Викторовна, 544 гр. Научный руководитель:
Методы построения и программное обеспечение вычислительных кластеров Дмитрий Лайком гр. 8ВМ23.
Пользовательская среда многопроцессорного комплекса.
Стадник Е. Г. ФПМИ НГТУ Руководитель: Городничев М.А., м.н.с. ИВМ и МГ СО РАН.
Параллельные синхронизированные вычисления - первый шаг к построению прототипа модели агроландшафта Гавлин А.В., Топаж А.Г.
Презентация проекта Балансировка загрузки Учебная лаборатория SWsoft на ФИТ НГУ Лидер проекта: Лобачёв Иван Разработчики: Ковалёв Дмитрий, Арискин Дмитрий,
Супер ЭВМ Понятие Супер ЭВМ Цели Супер ЭВМ Характеристики производительности Супер ЭВМ Программное обеспечение Супер ЭВМ Архитектура совеременных Супер.
Выполнил студент группы А Буренков Сергей Александрович. Научный руководитель к.т.н., доцент Шамаева Ольга Юрьевна. ОРГАНИЗАЦИЯ И ИССЛЕДОВАНИЕ ПАРАЛЛЕЛЬНО-ПОСЛЕДОВАТЕЛЬНЫХ.
Нагрузочное тестирование информационных систем с использованием облачных вычислений Исполнитель: Макрушин Д.Н. Руководитель: д.т.н., проф. Запечников С.В.
Выполнили: Мартышкин А. И. Кутузов В. В., Трояшкин П. В., Руководитель проекта – Мартышкин А. И., аспирант, ассистент кафедры ВМиС ПГТА.
Диаграммы компонентов применяют при проектировании физической структуры разрабатываемо программного обеспечения. Эти диаграммы показывают, как выглядит.
Система разработки и поддержки исполнения параллельных программ Сальников А. Н. Факультет ВМиК МГУ.
Транксрипт:

Задача построения множественного выравнивания

Последовательности в Fasta формате (вход) >sw|P04252|BAHG-VITST Bacterial hemoglobin. MLDQQTINIIKATVPVLKEHGVTITTTFYKNLF >sw|Q8UUR3|CYGB1-DANRE Cytoglobin-1. MEGDGGVQLTQSPDSLTEEDVCVIQDTWKPVYAERDNA GVAVLVRFFTNFPSAKQ >sw|Q575T0|CYGB1-ORYLA Cytoglobin-1. MERKQGEVDHLERSRPLTDKERVMIQDSWAKVYQNCDD AGVAILVRLFVNFPSSKQY >sw|Q575S8|CYGB2-DANRE Cytoglobin-2. MEKEREDEETEGRERPEPLTDVERGIIKDTWARVYASC EDVGVTILIRFFVNFPSAKQY

Выравнивание (выход) MLDQQTINIIKAT-VPVLKEH---GVTITTTFYKNL------F ---MEGDGGVQLTQSPDSLTEEDVCVIQDTWKPVYAERDNAGVAVLVRFFTNFPSAKQY --MERKQGEVDHLERSRPLTDKERVMIQDSWAKVYQNCDDAGVAILVRLFVNFPSSKQY MEKEREDEETEGRERPEPLTDVERGIIKDTWARVYASCEDVGVTILIRFFVNFPSAKQY В последовательности вставляются специальные пробельные символы «indel» Цель минимизировать число пробелов, при максимизации числа «одинаковых» символов в столбце. По выравниваниям исследуется эволюция геномов и протеомов.

Некоторые известные алгоритмы множественного выравнивания Последовательные MAFFT T-COFFE ClustalW MUSCLE Dialign Параллельные (реализация для кластера) ClustalW-MPI Pdialign MUSCLE (Модификация для кластеров ВМК МГУ)

Параллельная реализация MUSCLE В исходном алгоритме модифицирована стадия стадия построения промежуточных выравниваний по бинарному кластерному дереву Параллелизм за счёт параллельного обхода дерева от листьев к корню. Программа реализована с использованием языка «PARUS» ( Язык описывает параллельную программу как граф потока данных.

Эффективность алгоритма исследована на выравнивании последовательностей LTR (Long Terminal Repeat) класса 5 в геноме человека, класс 5 (LTR5) содержит приблизительно 1500 последовательностей по 1200 нуклеотидов. 13 семейств 1011 аминокислотных последовательностей приблизительно по 300 аминокислотных остатков каждая. Максимально удалось использовать 500 процессоров машины МВС-100к.

Результаты запуска на Чебышев-МГУ (последовательности LTR5)

Результаты запуска на Чебышев-МГУ семейства белков

Интернет-сервис создан для повышения доступности использования многопроцессорной техники при решении задачи построения множественного выравнивания. В текущий момент поддерживает Параллельный MUSCLE и ClustalW- MPI. Веб-интерфейс

Граф изменения статуса задачи поставленной через веб- интерфейс ready задача готова к запуску на кластере submited запущена на кластере finished корректно завершена можно скачать ответ

Биоинформатические HPC ресурсы с факультета ВМК

Наличие программного обеспечения на вычислительных кластерах МГУ