Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемГригорий Соломатин
1 Сравнение возможностей инструментария разработки программного обеспечения графических процессоров
2 GPU – мультиядерные чипы, предназначенные для параллельных вычислений Сотни скалярных процессоров Десятки тысяч одновременно выполняемых потоков Пиковая производительность 1 TFLOPS (единичная точность), 0.5 TFLOPS (двойная точность) Вычисления с параллелизмом данных
3 В отличие от CPU, большая часть транзисторов отведена под арифметику/логику, а не под инструкции/кэш
4 Массивно-параллельные части кода выполняются на GPU как ядра (kernels) В каждый момент времени выполняется одно ядро Каждое ядро обрабатывается множеством потоков Каждый поток выполняет один и тот же код Каждый поток имеет идентификатор, который позволяет вычислить позицию в памяти и осуществлять ветвления
5 Задача Дирихле для уравнения Пуассона
6 Пятиточечный шаблон Метод Гаусса-Зейделя
9 Размер сетки 256x256 УстройствоВремя решенияУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS12232,12,1 Размер сетки 512x512 УстройствоВремя решенияУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS26564,24,2
10 Размер сетки 1024x1024 УстройствоВремя решения, мсУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS80115,35,3 Размер сетки 2048x2048 УстройствоВремя решенияУскорение Последовательный алгоритм CPU Core 2 Duo P CPU Core 2 Duo E CUDA реализация GPU nVidia GeForce 450 GTS295515,8
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.