Массивно-параллельное решение уравнения Пуассона с использованием.

Презентация:



Advertisements
Похожие презентации
Сравнение возможностей инструментария разработки программного обеспечения графических процессоров.
Advertisements

V Всероссийская конференция молодых ученых А. А. Давыдов ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ УСКОРЕНИЯ РАСЧЕТА ЗАДАЧ АЭРО-ГАЗОДИНАМИКИ С ПОМОЩЬЮ ВЕКТОРНЫХ СОПРОЦЕССОРОВ.
Дипломная работа Преснова И.М Научный руководитель Демьянович Ю. К
Проект: Система управления распределенными структурами данных (СУРД) «Разработка MPI-приложения для численного решения уравнения Пуассона» Выполнил: Халяпин.
Иерархия памяти CUDA. Глобальная память. Параллельные решения задач умножения матриц и решения СЛАУ. zЛекторы: yБоресков А.В. (ВМиК МГУ)Боресков А.В. (ВМиК.
Сравнительный анализ различных реализаций фильтра Гаусса.
Суперкомпьютер «УРАН» Андрей Созыкин Заведующий сектором суперкомпьютерных технологии ИММ УрО РАН Заведующий кафедрой высокопроизводительных.
Половинкин А.Н.. Постановка задачи Алгоритм вычисления функции axpy на GPU Программная реализация.
Работа с матрицами Задача 1. Выполните действия с матрицами.
Assignment 4.1 Решение уравнения Пуассона Е.Е. Перепелкин 6 апреля 2010
Параллельная реализация итерационных методов решения уравнения Пуассона Н.Н. Богословский, А.О. Есаулов Томский государственный Университет, г. Томск.
Использование CUDA в расчете динамики пучка С.Б. Ворожцов, В.Л. Смирнов, Е.Е. Перепелкин Дубна, ОИЯИ 6 апреля 2010
Нижегородский государственный университет им. Н.И.Лобачевского Факультет Вычислительной математики и кибернетики Применение технологии Cilk для решения.
я 50*60:100= н 4000*3:100= в = н 140:70*2000= р = и 80*4+60*3= а( ):4= е 10000:2-1= У 842*1000*0=
Половинкин А.Н.. Постановка задачи Алгоритм умножения матриц на GPU Программная реализация.
МУЛЬТИМЕДИЙНАЯ ВЕРСИЯ УЧЕБНИКА ОБЩАЯ ФИЗИКА КИНЕМАТИКА (ФРАГМЕНТ) ШКОЛА-ВУЗ Кафедра общей физики и ядерного синтеза МЭИ Центр новых информационных технологий.
Прямолинейное равноускоренное движение. Равноускоренное движение Равноускоренным называется такое движение, при котором за любые равные промежутки времени.
Компьютер устройство или система, способное выполнять заданную, чётко определённую изменяемую последовательность операций. Это чаще всего операции численных.
10*2=20 2*2=4 1*2=2 3*3=9 4*2=8 3*5=15 4 x 8 = 32 2*3=6 4*1=4.
Методы интерактивной визуализации динамики жидких и газообразных сред Костикова Елена Юрьевна, 521 гр. Научный руководитель: Игнатенко Алексей Викторович.
Транксрипт:

Массивно-параллельное решение уравнения Пуассона с использованием

Почему была выбрана достаточно не сложная задача( Poisson 1D )? Численное решение уравнения Пуассона оптимально подходит в целях освоения параллелизации Cuda для задач численного решения ДУЧП. (Если эта задача ускоряется то значит ускоряются и другие). Уравнение Пуассона может быть расширено до 2D, 3D случаев заменой матрицы и правой части СЛАУ.

Уравнение Пуассона

Метод решения СЛАУ

Описание метода

Конфигурация Сравнение происходило на машине: CPU: Intel Core i5 GPU: nVidia GeForce 9800 Заметим, что карта на данный момент к сожалению является морально устаревшей. На лучшей видеокарте возможно добиться лучшего ускорения.

Подходы к ||-ю Cuda Попытка ||-ить все операции, каждая из которых __global__ с интерфейсом, в котором происходит cudaMemcpy Попытка ||-ить все операции, каждая из которых __global__ без интерфейса и без cudaMemcpy Попытка ||-ить все операции, каждая из которых __device__, всё вызывается в одном __global__

Использованный подход Ускорение было получено при ||-ии на Cuda самой «тяжелой» операции, а именно умножения матрицы на вектор.

Расчеты Сетка NCPU( в сек )GPU( в сек )xSpeedup , , , , , , , ,

Время выполнения

Ускорение