Объединение нескольких вычислительных установок для решения одной параллельной задачи А.Инюхин, А.Баранов Во время этого доклада может возникнуть дискуссия с предложениями конкретных действий. Используйте PowerPoint для записи предложений по ходу обсуждения: Во время демонстрации щелкните правой кнопкой мыши Выберите Записная книжка Выберите вкладку Действия Вводите замечания по мере поступления Нажмите кнопку ОК по завершении доклада В результате в конец презентации автоматически будет добавлен слайд Действия со списком внесенных предложений.
Постановка задачи Составная задача - параллельная задача, которую надо запустить на нескольких вычислителях Предполагается, что вычислители независимые, и на каждом функционирует Система управления прохождением задач (СУПЗ) Необходимо решить две проблемы: 1.Синхронное прохождение частей составной задачи через очереди СУПЗ и подготовка синхронного старта. 2.Организация собственно синхронного старта и контроля за выполнением составной задачи.
Логические подсистемы СУПЗ Сервер очередей (процесс qserver) Сервер запросов (процесс runmvsd) Менеджер задачи (процесс mrun) Процесс запуска задачи (runtask) системы default Процесс запуска задачи (runtask) системы globus Обычная параллельная задачаЧасть составной задачи Менеджер задачи (процесс mrun)
Вызовы при запуске задачи Формирование RSL- файла taskrun: разбор RSL-файла Вызов globusrun Gatekeeper, авторизация на каждом кластере Jobmanager-mvs, менеджер СУПЗ: формирование конфигурации для PACX-MPI Вызов специальной команды СУПЗ pacxrun: формирование паспорта задачи СУПЗ Передача задачи СУПЗ через вызов клиента runmvs