Скачать презентацию
Идет загрузка презентации. Пожалуйста, подождите
Презентация была опубликована 12 лет назад пользователемwww.parallel.ru
1 Московский государственный университет им.М.В.Ломоносова Институт вычислительной математики РАН Воеводин В.В., Воеводин Вл.В. СУПЕРВЫЧИСЛЕНИЯ: средства, теория, образование
2 Параллельные вычисления Архитектура компьютеров Технологии программирования Методы, задача отображения Теоретические исследования Практика Образование П о л ь з о в а т е л ь
3 От идеи - до реализации Задача Метод Алгоритм Технология программирования Программа Компьютер
4 Последовательный алгоритм
5 Параллельный алгоритм
6 Технологии параллельного программирования Традиционные языки + компиляторы Расширения последовательных языков, спецкомментарии Специальные языки параллельного программирования Библиотеки и интерфейсы для взаимодействия параллельных процессов: MPI, PVM, Linda, Shmem... Параллельные предметные библиотеки: SCALAPACK, MKL, FFTW, DFFTpack, PETSc, CRAY Scientific Library... Специализированные пакеты и программные комплексы: PC-GAMESS, PRIRODA, GAUSSIAN… ЭФФЕКТИВНОСТЬ - ПЕРЕНОСИМОСТЬ - ПРОДУКТИВНОСТЬ
7 Статический анализ структуры программ Это можно исполнять параллельно
8 Статический анализ структуры программ А это - только последовательно
10 Динамический анализ структуры программ
11 Пиковая производительность. Проект Blue Gene Процессор - 1 Gflops 32 процессора на кристалле 64 кристалла на плате 8 плат в стойке 64 стойки в проекте $100 M 1Pflops = flops
12 Что снижает производительность? (CRAY C90, T90) закон Амдала время разгона конвейера секционирование векторных команд конфликты в памяти каналы процессор-память операции чтения/записи в векторные регистры ограниченное число векторных регистров несбалансированное использование устройств отсутствие операции деления перезагрузка буферов команд...
13 Что снижает производительность? Производительность CRAY C90 на операции a i = b i +c i *d
14 Оптимизация программы LIU_FTC для компьютеров CRAY Y-MP C90 Моделирование устойчивости плазмы в установках управляемого термоядерного синтеза (General Atomics, San-Diego, USA; данные с действующей установки D III-D) 490 подпрограмм и функций, более строк Время работы 1 итерации исходного варианта с. (QSL: 257 с., NNL:63 с., QSLH: 6.4 с.) Время работы 1 итерации нового варианта с. (QSL: 11.8 с., NNL: 5 с., QSLH: 1.4 с.)
15 Структуризация предметной области: в идеале - энциклопедия, минимум - справочник. Формирование среды общения профессионалов Центр создан при поддержке РФФИ Информационно-аналитический Центр в сети Интернет
16 Параллельные вычисления - погоня за эффективностью В.В.Воеводин, Вл.В.Воеводин 1. Что скрывает обыкновенный компьютер 2. Как повышают производительность компьютеров 3. Параллельные вычислительные системы 4. Большие задачи и параллельные вычисления 5. Параллельное программирование 6. Статический анализ и преобразование программ 7. Отображение задач вычислительной математики на архитектуру вычислительных систем 8. Пользователь в среде параллелизма
19 Метакомпьютинг
20 Учебно-научный центр МГУ по высокопроизводительным вычислениям Команда специалистов Высокопроизводительные ресурсы Поддержка научных исследований Учебный процесс Инфраструктура поддержки пользователей Инфраструктура программного обеспечения Организационно-методическая работа Информационная поддержка
Еще похожие презентации в нашем архиве:
© 2024 MyShared Inc.
All rights reserved.