Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 11 лет назад пользователемhpc.icc.ru
1 Ускорение MATLAB на GPU
2 GPGPU General-Purpose Graphics Processing Units (2003 г.) – («GPU общего назначения») – техника использования графического процессора видеокарты для общих (неграфических) вычислений, которые обычно проводит центральный процессор. Применение GPGPU: Вычислительная математика Вычислительная биология Вычислительная экономика Моделирование в физике Обработка сигналов…
3 CPUGPU Память оптимизирована под минимальную латентность (системакэшей). Много транзисторов управления (предсказание ветвлений, планировщики и пр.). Архитектура оптимизирована для программ со сложным управлением (эффективная обработка ветвлений). Память оптимизирована под максимальную пропускную способность. Большая часть транзисторов для вычислений. Архитектура оптимизирована для программ с большим объемом вычислений (параллелизм по данным типа SIMD). Латентность скрывается вычислениями во время запросов к памяти.
4 GPU демонстрируют хорошие результаты в параллельной обработке данных: с одной и той же последовательностью действий, применяемых к большому объёму данных (многопоточные вычисления), что подразумевает меньшие требования к управлению исполнением, c высокой плотностью арифметики - высоким отношением числа арифметических операций к числу обращений к памяти, что означает возможность покрытия латентности памяти вычислениями.
5 CUDA Compute Unified Device Architecture (2007 г.) - новая программно-аппаратная архитектура NVIDIA для параллельных вычислений на GPU, предоставляющая средства (toolkit) для организации вычислений общего назначения на GPU Присутствует в GPU NVidia: GeForce 8800 и выше, Quadro FX 5600/4600 и выше, Tesla серии 10, Tesla серии 20 (Fermi).
6 CUDA Toolkit компилятор nvcc; библиотеки CuFFT и CuBLAS; профилировщик; отладчик gdb для GPU; API высокого уровня (CUDA Runtime) и API низкого уровня (CUDA Driver); руководство по программированию; CUDA Developer SDK (исходный код, утилиты и документация).
7 Вычислительный сервер на базе GPU NVidia Tesla Конфигурация: Платформа SuperServer SYS-7046GT-TRF-TC4 CPU 2 x Intel Nehalem 4Core X GHz RAM 12 x 2 GB RAM HDD 8 x 500 GB SATA GPU 4 x TESLA C1060 (4 x 240 ядер) Пик. произв. (SP) ~3,73 TFlops (4 GPU) Пик. произв. (DP) 312 GFlops (4 GPU)
8 GPU NVidia Tesla C1060 Total amount of device memory: 4 GB Number of multiprocessors: 30 Number of cores: 240 Clock rate: 1.30 GHz
9 Вычислительный сервер на базе GPU NVidia Tesla Программное обеспечение: OS Gentoo Linux (kernel ) Intel C/C++/F90/F95 (v.11.1) CUDA Toolkit (v.3.2) AccelerEyes Jacket (v.1.3) Multi-GPU License (4 GPU) Matlab ( R2010b 64-bit) Concurrent Network License
10 AccelerEyes Jacket accelerates MATLAB code on GPUs. With minimal knowledge and time, single threaded M-codes are transformed to GPU-enabled applications that fully leverage hardware. Thousands of MATLAB function syntaxes are supported. Jacket is designed for engineers, scientists, and analysts who want maximum performance and maximum leverage of GPU resources, without hassling with low-level programming details. Jacket automatically translates M-code to high performance primitives required for best utilization of GPUs. All GPU- specific programming details are handled by Jacket, freeing the user to focus on science, engineering, and analytics.
11 AccelerEyes Jacket пример кода Matlab + Jacket:
13 Ускорение MATLAB на GPU
14 Parallel Computing Toolbox lets you solve computationally and data-intensive problems using multicore processors, GPUs, and computer clusters. High-level constructs - parallel for-loops, special array types, and parallelized numerical algorithms let you parallelize MATLAB applications without CUDA or MPI programming. You can use the toolbox with Simulink to run multiple simulations of a model in parallel. The toolbox provides eight workers (MATLAB computational engines) to execute applications locally on a multicore desktop. Without changing the code, you can run the same application on a computer cluster or grid (using MATLAB Distributed Computing Server).
16 Вычислительный сервер на базе GPU NVidia Tesla Программное обеспечение: OS Gentoo Linux (kernel ) Intel C/C++/F90/F95 (v.11.1) CUDA Toolkit (v.3.2) AccelerEyes Jacket (v.1.3) Multi-GPU License (4 GPU) Matlab ( R2010b 64-bit) Concurrent Network License
17 Благодарю за внимание! ИДСТУ СО РАН Суперкомпьютерный центр коллективного пользования тел.: , URL:
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.