Сравнение возможностей инструментария разработки программного обеспечения графических процессоров.

Презентация:



Advertisements
Похожие презентации
Массивно-параллельное решение уравнения Пуассона с использованием.
Advertisements

Факультет прикладной математики и физики Кафедра вычислительной математики и программирования МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (национальный исследовательский.
V Всероссийская конференция молодых ученых А. А. Давыдов ИССЛЕДОВАНИЕ ВОЗМОЖНОСТЕЙ УСКОРЕНИЯ РАСЧЕТА ЗАДАЧ АЭРО-ГАЗОДИНАМИКИ С ПОМОЩЬЮ ВЕКТОРНЫХ СОПРОЦЕССОРОВ.
Лекция 1. Архитектура и программирование массивно- параллельных вычислительных систем Summer of coding. CUDA course. Борисов Александр
CONFLUX: GPGPU ДЛЯ.NET Евгений Бурмако Андрей Воронович.
САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АЭРОКОСМИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ АКАДЕМИКА С.П. КОРОЛЕВА (национальный исследовательский университет) Якимов Павел Юрьевич,
1 Математическое и алгоритмическое обеспечение параллельных вычислений на графических процессорах на примере задачи распознавания объектов на изображении.
Современные микропроцессоры Тенденции развития. Рассматриваемые процессоры Intel Itanium 2 Intel Core 2 Duo IBM Cell.
Сравнительный анализ различных реализаций фильтра Гаусса.
Дипломная работа Преснова И.М Научный руководитель Демьянович Ю. К
Введение в параллельную обработку. Уровни параллелизма в процессорах Параллелизм данных (DLP – Data Level Parallelism) Параллелизм команд (ILP – Instruction.
КВНО апреля 2013 г. ИПА РАН Суркис И. Ф., Зимовский В. Ф., Шантырь В. А., Кен В. О., Мишин В. Ю., Соколова Н. А., Павлов Д.А. Характеристики.
Технологии высокопроизводительных вычислений на GPU и гибридных вычислительных системах Аксёнов Сергей Владимирович к.т.н., доцент каф.ОСУ ТПУ Томский.
Суперкомпьютер «УРАН» Андрей Созыкин Заведующий сектором суперкомпьютерных технологии ИММ УрО РАН Заведующий кафедрой высокопроизводительных.
Массивно-параллельные вычислительные системы на основе архитектуры CUDA.
Архитектура ЭВМ (лекция 7) проф. Петрова И.Ю. Курс Информатики.
Оценка эффективности параллельных вычислений Комышев Е. Г. гр
Летняя школа 2012 Проект Программирование графических ускорителей Задача Моделирование движения N тел в гравитационном поле автор: Купчишин А.Б. руководитель:
Принципы адаптации вычислительных алгоритмов под параллельную архитектуру графических акселераторов С.М.Вишняков научный руководитель: д.т.н. А.В.Бухановский.
Система фрагментированного программирования Перепелкин В.А. Всероссийская молодежная школа по параллельному программированию МО ВВС ИВМиМГ 2009 г.
Транксрипт:

Сравнение возможностей инструментария разработки программного обеспечения графических процессоров

GPU – мультиядерные чипы, предназначенные для параллельных вычислений Сотни скалярных процессоров Десятки тысяч одновременно выполняемых потоков Пиковая производительность 1 TFLOPS (единичная точность), 0.5 TFLOPS (двойная точность) Вычисления с параллелизмом данных

В отличие от CPU, большая часть транзисторов отведена под арифметику/логику, а не под инструкции/кэш

Массивно-параллельные части кода выполняются на GPU как ядра (kernels) В каждый момент времени выполняется одно ядро Каждое ядро обрабатывается множеством потоков Каждый поток выполняет один и тот же код Каждый поток имеет идентификатор, который позволяет вычислить позицию в памяти и осуществлять ветвления

Задача Дирихле для уравнения Пуассона

Пятиточечный шаблон Метод Гаусса-Зейделя

Размер сетки 256x256 УстройствоВремя решенияУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS12232,12,1 Размер сетки 512x512 УстройствоВремя решенияУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS26564,24,2

Размер сетки 1024x1024 УстройствоВремя решения, мсУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS80115,35,3 Размер сетки 2048x2048 УстройствоВремя решенияУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS295515,8