V Всероссийская конференция молодых ученых А. А. Давыдов ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ УСКОРЕНИЯ РАСЧЕТА ЗАДАЧ АЭРО-ГАЗОДИНАМИКИ С ПОМОЩЬЮ ВЕКТОРНЫХ СОПРОЦЕССОРОВ.

Презентация:



Advertisements
Похожие презентации
Часть I: Введение в CUDA Александр Межов Ассистент кафедры Информатики 30 сентября 2011 Кафедра Информатики.
Advertisements

Использование CUDA в расчете динамики пучка С.Б. Ворожцов, В.Л. Смирнов, Е.Е. Перепелкин Дубна, ОИЯИ 6 апреля 2010
Массивно-параллельные вычислительные системы на основе архитектуры CUDA.
Архитектура Tesla. Программно-аппаратный стек CUDA. zЛекторы: yБоресков А.В. (ВМиК МГУ)Боресков А.В. (ВМиК МГУ) yХарламов А.А. (NVidia)Харламов А.А. (NVidia)
Сравнение возможностей инструментария разработки программного обеспечения графических процессоров.
Технологии высокопроизводительных вычислений на GPU и гибридных вычислительных системах Аксёнов Сергей Владимирович к.т.н., доцент каф.ОСУ ТПУ Томский.
Массивно-параллельное решение уравнения Пуассона с использованием.
Структура ПО CUDA Приложения, использующие возможности CUDA для параллельной обработки данных, взаимодействуют с GPU через несколько разных программных.
Работу выполнил: Вилданов В.Р. Научный руководитель: Сергеев О.Б.
Принципы адаптации вычислительных алгоритмов под параллельную архитектуру графических акселераторов С.М.Вишняков научный руководитель: д.т.н. А.В.Бухановский.
Лекторы: Боресков А.В. (ВМиК МГУ) Харламов А. (NVidia) Архитектура и программирование массивно- параллельных вычислительных систем.
Гужва А.Г. Использование нейронных сетей для решения обратной задачи Магнитотеллурического Зондирования.
Assignment 4.1 Решение уравнения Пуассона Е.Е. Перепелкин 6 апреля 2010
Лекторы: Боресков А.В. (ВМиК МГУ) Харламов А.А. (NVidia) CUDA Stream. Иерархия памяти в CUDA. Глобальная память.
Лекторы: Боресков А.В. (ВМиК МГУ) Харламов А. (NVidia) Архитектура и программирование массивно- параллельных вычислительных систем.
Санкт-Петербургский государственный университет информационных технологий, механики и оптики Санкт-Петербург 2009 Санкт-Петербургский государственный университет.
Половинкин А.Н.. Постановка задачи Алгоритм умножения матриц на GPU Программная реализация.
Лекторы: Боресков А.В. (ВМиК МГУ) Харламов А. (NVIDIA) Архитектура и программирование массивно- параллельных вычислительных систем.
Сравнение производительности NVidia NPP и Intel IPP Участники: Калишев Глеб Майоров Алексей Руководитель: Половинкин Алексей Участники: Калишев Глеб Майоров.
Архитектура и программирование массивно-параллельных вычислительных систем zЛекторы: yБоресков А.В. (ВМиК МГУ)Боресков А.В. (ВМиК МГУ) yХарламов А. (NVidia)Харламов.
Транксрипт:

V Всероссийская конференция молодых ученых А. А. Давыдов ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ УСКОРЕНИЯ РАСЧЕТА ЗАДАЧ АЭРО-ГАЗОДИНАМИКИ С ПОМОЩЬЮ ВЕКТОРНЫХ СОПРОЦЕССОРОВ

Введение Обзор физической реализации Средства разработки программ Тестовые расчеты Выводы

Сравнительная производительность CPU и GPU

Compute Unified Device Architecture Software Stack

Блоки трэдов и сетка блоков

Физическая модель NVidia GeForce 8800

Интерфейс CUDA (Compute Unified Device Architecture) Расширение языка C: Дополнительные идентификаторы функций Дополнительные идентификаторы переменных Новая директива запуска ядра Встроенные переменные

Дополнительные идентификаторы Идентификаторы функций __device__ __global__ __host__ Идентификаторы переменных __device__ __constant__ __shared__ Встроенные переменные gridDim blockIdx blockDim threadIdx

Пример: Заданы входные массивы U1, P1, R1, U2, P2, R2 U = U(U1, P1, R1, U2, P2, R2); P = P(U1, P1, R1, U2, P2, R2); R = R(U1, P1, R1, U2, P2, R2); S 1,2,3 = S 1,2,3 (U1, P1, R1, U2, P2, R2); U, P, R, S 1,2,3 – величины получаемые из решения задачи Римана о распаде произвольного разрыва. При длине массива Время расчета на Intel P4 (3GHz) и NVidia GeForce 8800 GTX различаетя в 180 раз в пользу последнего!!!

Уравнения Эйлера в декартовых координатах: Схема расчетной области:

Intel P4 (3GHz) Core2Duo (2GHz) AMD Opteron 248 GeForce 8600M GT GeForce 8800 GTX Время мсек Относительно G ,8629,4117,405,261 Поле давления при числе Маха набегающего потока 3.38 Время расчета шагов по времени