OpenMP. Различие между тредами и процессами ПроцессыТреды.

Презентация:



Advertisements
Похожие презентации
OpenMPOpenMPРазличие между тредами и процессами ПроцессыТреды.
Advertisements

Многопоточное программирование в OpenMP Киреев Сергей ИВМиМГ.
Параллельное программирование с использованием технологии OpenMP Аксёнов Сергей Владимирович к.т.н., доцент каф.ОСУ ТПУ Лекция 2 Томский политехнический.
Основы OpenMP Nikita Panov
Вложенные параллельные области Если переменная среды OMP_NESTED имеет значение true, то любая нить параллельной области может породить новую параллельную.
Нижегородский государственный университет им. Н.И.Лобачевского Факультет Вычислительной математики и кибернетики Введение в OpenMP Гергель В.П., Сысоев.
Гергель В.П. Общий курс Теория и практика параллельных вычислений Лекция 15 Методы разработки параллельных программ для многопроцессорных систем с общей.
Гергель В.П. Общий курс Теория и практика параллельных вычислений Лекция 16 Методы разработки параллельных программ для многопроцессорных систем с общей.
Разработка параллельных приложений для многоядерных систем С.В. Ковальчук НИИ Наукоемких компьютерных технологий, СПбГУ ИТМО.
Параллельное программирование с использованием технологии OpenMP Аксёнов Сергей Владимирович к.т.н., доцент каф.ОСУ ТПУ Лекция 3 Томский политехнический.
Интернет Университет Суперкомпьютерных технологий Конструкции для синхронизации нитей Учебный курс Параллельное программирование с OpenMP Бахтин В.А.,
Параллельное программирование с использованием технологии OpenMP Аксёнов Сергей Владимирович к.т.н., доцент каф.ОСУ ТПУ Томский политехнический университет.
POSIX Threads & OpenMP Общая память Сергей Петрович Нечаев, Сибирский Суперкомпьютерный центр.
Интернет Университет Суперкомпьютерных технологий Основные понятия Учебный курс Параллельное программирование с OpenMP Бахтин В.А., кандидат физ.-мат.
Е.Ю. Алексеева Механико-математический факультет Южно-Уральского государственного университета.
Программирование многоядерных архитектур (слайды для лекции 2013/04/20) Киреев С.Е., Маркова В.П., Остапкевич М.Б., Перепелкин В.А. МО ВВС ИВМиМГ СО РАН.
Технология программирования OpenMP Антонов Александр Сергеевич, к.ф.-м.н., с.н.с. лаборатории Параллельных информационных технологий НИВЦ МГУ.
Интернет Университет Суперкомпьютерных технологий Основные понятия Учебный курс Параллельное программирование с OpenMP Бахтин В.А., кандидат физ.-мат.
Е.Ю. Алексеева Механико-математический факультет Южно-Уральского государственного университета.
1 Введение в OpenMP Параллельное программирование.
Транксрипт:

OpenMP

Различие между тредами и процессами ПроцессыТреды

Общие и распределенные данные var распределенные общие

Архитектура OpenMP Приложение OpenMP компилятор OpenMP библиотека Треды ОС Пользователь Переменные среды

Модель выполнения OpenMP приложения

Работа с вычислительным пространством Мастер-тред имеет номер 0 Число тредов, выполняющих работу определяется: - переменная окружения OMP_NUM_THREADS - вызов функции omp_set_num_threads() Определение «своих» координат в вычислительном пространстве: - свой номер: omp_get_thread_num() - число тредов: omp_get_threads_num()

Общий синтаксис директив OpenMP #pragma omp directive_name [clause[clause...]] newline Действия, соответствующие директиве применяются непосредственно к структурному блоку, расположенному за директивой. Структурным блоком может быть любой оператор, имеющий единственный вход и единственный выход. Если директива расположена на файловом уровне видимости, то она применяется ко всему файлу.

Директива parallel Данная директива – единственный способ инициировать параллельное выполнение программы. #pragma omp parallel [clause...] clause: if (scalar_expression) private (list) shared (list) default (shared | none) firstprivate (list) reduction (operator: list) copyin (list)

#include main () { int nthreads, tid; #pragma omp parallel private(nthreads, tid) { tid = omp_get_thread_num(); printf("Hello World from thread = %d\n", tid); if (tid == 0) { nthreads = omp_get_num_threads(); printf("Number of threads = %d\n", nthreads); }

Опции для данных Данные, видимые в области, объемлющей блок параллельного исполнения, являются общими (shared). Переменные, объявленные внутри блока п.и. считаются распределенными (private). Опция private задает список распределенных переменных. Только shared-переменные в объемлющей параллельном блоке могут быть аргументами опции private Опция private

Опция firstprivate Опция firstprivate обладает той же семантикой, что и опция private. При этом, все копии переменной инициализируются значением исходной переменной до входа в блок. Опция lastprivate Опция lastprivate обладает той же семантикой, что и опция private. При этом, значение переменной после завершения блока параллельного исполнения определяется как ее значение на последней итерации цикла или в последней секции для work-sharing конструкций.

Опция default Опция default задает опцию по-умолчанию для переменных. Пример: #pragma omp parallel default(private) Опция shared Опция shared задает список общих переменных. #pragma omp parallel default(private) shared(x)

опция reduction Опция reduction определяет что на выходе из параллельного блока переменная получит комбинированное значение. Пример: #pragma omp for reduction(+ : x) Допустимы следующие операции: +, *, -, &, |, ^, &&, ||

Глобальные общие данные Проблема: опция private «работает» только для статически-видимых ссылок в пределах параллельного участка: static int a; f() { printf(%d\n, a); } main() { #omp parallel private (a) { a = omp_num_thread(); f(); } } значение a неопределено

Директива threadprivate #omp threadprivate (список глобальных переменных) переменные становятся общими для всех тредов: static int a; f() { printf(%d\n, a); } main() { #omp threadprivate(a) #omp parallel { a = omp_num_thread(); f(); } }

Опция copyin Опция copyin директивы parallel определяет порядок инициализации threadprivate-переменных: эти переменные инициализируются значением на master-треде в начале параллельного участка.

Управление распределением вычислений Для распределения вычислений применяются конструкции: for sections single

Директива for #pragma omp for [clause...] clause: schedule (type [,chunk]) ordered private (list) firstprivate (list) lastprivate (list) reduction (operator: list) nowait

Директива предшествует циклу for канонического типа: for(init-expr, var logical_op b, incr_expr) init_expr ::= var = expr logical_op>, =,

incr_expr ::= var var var var var += incr var -= incr var = incr + var var = var + incr var = var – incr var переменная целого типа incr, lb, b инварианты цикла целого типа

Опция shedule директивы for Опция shedule допускает следующие аргументы: static - распределение осуществляется статически; dynamic - распределение осуществляется динамически (тред, закончивший выполнение, получает новую порцию итераций); guided - аналогично dynamic, но на каждой следующей итерации размер распределяемого блока итераций равен примерно общему числу оставшихся итераций, деленному на число исполняемых тредов, если это число больше заданного значения chunk, или значению chunk в противном случае (крупнее порция – меньше синхронизаций) runtime - распределение осуществляется во время выполнения системой поддержки времени выполнения (параметр chunk не задается) на основе переменных среды

Особенности опции schedule директивы for аргумент chunk можноиспользовать только вместе с типами static, dynamic, guided по умолчанию chunk считается равным 1 распараллеливание с помощью опции runtime осуществляется используя значение переменной OMP_SCHEDULE Пример. setenv OMP_SCHEDULE guided,4

#include #define CHUNK 10 #define N 100 main () { int nthreads, tid, i, n, chunk; float a[N], b[N], c[N]; for (i=0; i < N; i++) a[i] = b[i] = i * 1.0; n = N; chunk = CHUNK;

#pragma omp parallel shared(a,b,c,n,chunk) private(i,nthreads,tid) { tid = omp_get_thread_num(); #pragma omp for schedule(dynamic,chunk) for (i=0; i < n; i++){ c[i] = a[i] + b[i]; printf("tid= %d i= %d c[i]= %f\n", tid, i, c[i]); } if (tid == 0){ nthreads = omp_get_num_threads(); printf("Number of threads = %d\n", nthreads); }

Директива sections #pragma omp sections [clause...] structured_block clause: private (list) firstprivate (list) lastprivate (list) reduction (operator: list) nowait { #pragma omp section structured_block #pragma omp section structured_block }

#include #define N 50 main () { int i, n, nthreads, tid; float a[N], b[N], c[N]; for (i=0; i < N; i++) a[i] = b[i] = i * 1.0; n = N; #pragma omp parallel shared(a,b,c,n) private(i,tid,nthreads) { tid = omp_get_thread_num(); printf("Thread %d starting...\n",tid);

#pragma omp sections nowait { #pragma omp section for (i=0; i < n/2; i++) { c[i] = a[i] + b[i]; printf("tid= %d i= %d c[i]= %f\n",tid,i,c[i]); } #pragma omp section for (i=n/2; i < n; i++) { c[i] = a[i] + b[i]; printf("tid= %d i= %d c[i]= %f\n",tid,i,c[i]); }

if (tid == 0) { nthreads = omp_get_num_threads(); printf("Number of threads = %d\n", nthreads); }

Директива single #pragma omp single [clause...] structured_block Директива single определяет что последующий блок будет выполняться только одним тредом

Директивы синхронизации master critical barrier atomic flush ordered

Неконстинстентность данных

#pragma omp master определяет секцию кода, выполняемого только master- тредом #pragma omp critical [(name)] определяет секцию кода, выполняемого только одним тредом в данный момент времени #pragma omp barrier определяет секцию кода, выполняемого только одним тредом в данный момент времени

#pragma omp atomic ::== x binop = expr x x x x

#paragma omp flush [var-list] ::== x binop = expr x x x x Следующие содержат неявный flush: barrier, вход и выход из critical, ordered, выход из parallel, for, sections, single

Решение уравнения Пуассона методом верхней релаксации d 2 u/dx 2 + d 2 u/dy 2 – a * u = f 1 1 (1-x 2 )(1-y 2 )

Разностная схема u ij new = u ij – w /b *((u i-1,j + u i+1,j )/dx 2 + (u i,j-1 + +u i,j+1 )/dy 2 + b * u i,j – f i,j ) b = - (2/dx 2 + 2/dy 2 + a)

jacobi.f.txt