Московский государственный университет им.М.В.Ломоносова Институт вычислительной математики РАН Воеводин В.В., Воеводин Вл.В. СУПЕРВЫЧИСЛЕНИЯ: средства, теория, образование
Параллельные вычисления Архитектура компьютеров Технологии программирования Методы, задача отображения Теоретические исследования Практика Образование П о л ь з о в а т е л ь
От идеи - до реализации Задача Метод Алгоритм Технология программирования Программа Компьютер
Последовательный алгоритм
Параллельный алгоритм
Технологии параллельного программирования Традиционные языки + компиляторы Расширения последовательных языков, спецкомментарии Специальные языки параллельного программирования Библиотеки и интерфейсы для взаимодействия параллельных процессов: MPI, PVM, Linda, Shmem... Параллельные предметные библиотеки: SCALAPACK, MKL, FFTW, DFFTpack, PETSc, CRAY Scientific Library... Специализированные пакеты и программные комплексы: PC-GAMESS, PRIRODA, GAUSSIAN… ЭФФЕКТИВНОСТЬ - ПЕРЕНОСИМОСТЬ - ПРОДУКТИВНОСТЬ
Статический анализ структуры программ Это можно исполнять параллельно
Статический анализ структуры программ А это - только последовательно
Динамический анализ структуры программ
Пиковая производительность. Проект Blue Gene Процессор - 1 Gflops 32 процессора на кристалле 64 кристалла на плате 8 плат в стойке 64 стойки в проекте $100 M 1Pflops = flops
Что снижает производительность? (CRAY C90, T90) закон Амдала время разгона конвейера секционирование векторных команд конфликты в памяти каналы процессор-память операции чтения/записи в векторные регистры ограниченное число векторных регистров несбалансированное использование устройств отсутствие операции деления перезагрузка буферов команд...
Что снижает производительность? Производительность CRAY C90 на операции a i = b i +c i *d
Оптимизация программы LIU_FTC для компьютеров CRAY Y-MP C90 Моделирование устойчивости плазмы в установках управляемого термоядерного синтеза (General Atomics, San-Diego, USA; данные с действующей установки D III-D) 490 подпрограмм и функций, более строк Время работы 1 итерации исходного варианта с. (QSL: 257 с., NNL:63 с., QSLH: 6.4 с.) Время работы 1 итерации нового варианта с. (QSL: 11.8 с., NNL: 5 с., QSLH: 1.4 с.)
Структуризация предметной области: в идеале - энциклопедия, минимум - справочник. Формирование среды общения профессионалов Центр создан при поддержке РФФИ Информационно-аналитический Центр в сети Интернет
Параллельные вычисления - погоня за эффективностью В.В.Воеводин, Вл.В.Воеводин 1. Что скрывает обыкновенный компьютер 2. Как повышают производительность компьютеров 3. Параллельные вычислительные системы 4. Большие задачи и параллельные вычисления 5. Параллельное программирование 6. Статический анализ и преобразование программ 7. Отображение задач вычислительной математики на архитектуру вычислительных систем 8. Пользователь в среде параллелизма
Метакомпьютинг
Учебно-научный центр МГУ по высокопроизводительным вычислениям Команда специалистов Высокопроизводительные ресурсы Поддержка научных исследований Учебный процесс Инфраструктура поддержки пользователей Инфраструктура программного обеспечения Организационно-методическая работа Информационная поддержка