Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий
Основные понятия ДНК – последовательность нуклеотидов(сиквенс): А, G, C, T Репликация – процесс синтеза дочерней молекулы ДНК Ориджины(ORI) – место(
Мотивация Есть гипотезы о влиянии некоторых факторов на положение ORI Знания о положении ориджинов позволят: Регенерировать клетки и управлять ростом организмов Найти ключи к понимаю лечения рака Современные экспериментальные методы трудоемки, затратны, неточны Нет реальных вычислительных методов!
Гипотеза: Факторы Температура плавления(Tm) CpG-острова(CpG) Палиндромы(Pal) Геометрические факторы(Banana) Факторы транскрипций(Tfs)
Цели работы Изучить проблему нахождения ORI Сформулировать варианты решения Написать приложение для упрощение анализа сиквенсов на наличие факторов Уметь удобно получать сиквенсы и вычислять все факторы Исследовать зависимость ORI от факторов Попробовать с хорошей вероятностью определять, есть ли в последовательности ориджин
Используемые технологии Python, BioPython lib..Net, Neurodotnet lib.
Проблемы Нетронутость проблемной области Нет доказанных теорий Все с нуля Неоднозначность факторов Неясная интерпретация Гипотетичность темы
Двумя способами: Количественно, на весь сиквенс количество Cpg-островов, средняя темп. плавления, количество палиндромов и тд По окнам размером в 30 нуклеотидов Cpg, палиндромы, транскр.: сумма 3х минимальных расстояний до факторов. Темп. плавления, геом. факторы: среднее значение на окне. Обучение нейронной сети
Результаты(1\2) Практический вклад Сформирована база для дальнейшего исследования Был написано приложение, которое позволяет: Получить последовательности Вычислить все 5 факторов Вручную: Темп. плавления, Транскрипции Используя eMboss: остальные Посмотреть результаты вычисления факторов Посмотреть сосредоточение факторов в сиквенсе в виде графиков В нем реализована нейронная сеть, которая обучалась 2 вариантами: Факторы на сиквенс Факторы по окнам(30 нукл.) Результаты обоих вариантов неудовлетворительны.
Результаты(2\2) Теоретический вклад Известные сильные ORI-содержащие сиквенсы не отличаются от обычных по количеству или сосредоточению факторов => эти факторы слабо определяют, либо вовсе не определяют ORI
Контакты Skype: berezovaya_brunka Спасибо за внимание!