EGEE-II INFSO-RI-031688 Enabling Grids for E-sciencE www.eu-egee.org WMS (Workload Management System) и запуск заданий Олешко С.Б. Петербургский институт.

Презентация:



Advertisements
Похожие презентации
INFSO-RI Enabling Grids for E-sciencE Управление заданиями в GRID. Н. Клопов ПИЯФ, Гатчина.
Advertisements

EGEE-II INFSO-RI Enabling Grids for E-sciencE Запуск задач в EGEE (gLite 3.0) Олешко С.Б. Петербургский институт ядерной физики.
Администрирование LCG Игорь Ткачев 2 марта 2006г..
Ребусы Свириденковой Лизы Ученицы 6 класса «А». 10.
Типовые расчёты Растворы
Урок повторения по теме: «Сила». Задание 1 Задание 2.
1 I. Загрузка файлов Начало сессии. 4 II. Отображение окна.
Michael Jackson
Школьная форма Презентация для родительского собрания.
1. Определить последовательность проезда перекрестка
EGEE is a project funded by the European Union under contract IST Introduction to LCG-2 Введение в LCG-2 O.Kodolova (SINP MSU), E.Tikhonenko.

© 2006 Cisco Systems, Inc. All rights reserved. HIPS v Administering Events and Generating Reports Managing Events.
Масштаб 1 : 5000 Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
© 2002, Cisco Systems, Inc. All rights reserved. AWLF 3.0Module 7-1 © 2002, Cisco Systems, Inc. All rights reserved.
Масштаб 1 : 5000 Приложение 1 к решению Совета депутатов города Новосибирска от _____________ ______.
EGEE-II INFSO-RI Enabling Grids for E-sciencE Информационная система в gLite (практическая часть) Олешко С.Б. Петербургский институт.
© 2004, Cisco Systems, Inc. All rights reserved. CSPFA Lesson 8 Object Grouping.
В.Н. Ларин Протвино, ИФВЭ, В.Н. Ларин Протвино, ИФВЭ, Основы работы в среде Grid: от сертификации до запуска заданий составных типов.
Разработал: Учитель химии, биологии высшей квалификационной категории Баженов Алексей Анатольевич.
Транксрипт:

EGEE-II INFSO-RI Enabling Grids for E-sciencE WMS (Workload Management System) и запуск заданий Олешко С.Б. Петербургский институт ядерной физики г.Гатчина

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Использование заданий для запуска приложений Задание (job) – это средство для запуска приложений в Грид Информация, которая должна быть определена, когда задание должно быть запущено в Грид –Характеристики задания –Требования задания и условия на вычислительные ресурсы Включая требования на программное обеспечение –Требования к данным Эта информация определяется при помощи Job Description Language (JDL) –Основан на CLASSified ADvertisement language (ClassAd) из проекта Condor ClassAd – последовательность атрибутов, разделённых (;)

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Как это работает? Основные компоненты. User Interface (UI) User Interface (UI):Место, откуда пользователь вошёл в Грид Resource Broker (RB) Resource Broker (RB): Сопоставляет пользовательские требования и доступные ресурсы Грид Computing Element (CE) Computing Element (CE): Очередь на выполнение заданий на том кластере, где будет выполняться задание Storage Element (SE) Storage Element (SE): Сервер хранения данных, где сохраняются Грид файлы (чтение/запись/копирование) или их реплики. Information System Information System: Характеристики и статус для CE иSE (Используя GLUE schema)

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, EGEE/LCG Workload Management System Пользователь управляет заданиями через подсистему управления загрузкой (Workload Management System - WMS); Основная задача WMS - планирование и управление распределенными ресурсами в системе Grid; Что может пользователь? –Посылать задачи на выполнение; –Выполнять задачи на наиболее подходящих для этого ресурсах (WMS автоматически оптимизирует использование ресурсов); –Получать информацию о состоянии задач; –Получать результаты выполнения задач.

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Сервисы и запуск заданийReplicaCatalogue Logging & Book-keeping ResourceBrokerStorageElementComputingElement InformationService Job Status DataSets info Author. &Authen. Job Submit Event Job Query Job Status Input sandbox Input sandbox + Broker Info Output sandbox Publish SE & CE info User interface

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Выполнение задания SUBMITTED - задание послано пользователем, но пока не обработано Network Server WAITING - задание принято Network Server, но ещё не обработано Workload Manager READY - заданию назначен Computing Element, но оно туда ещё не передано SCHEDULED - задание ожидает в очереди на Computing Element RUNNING - задание выполняется DONE - задание завершилось ABORTED - задание снято WMS (т.к. слишком долгое, срок действия сертификата истёк, и т.п.) CANCELLED - задание снято пользователем CLEARED - Output Sandbox передан на User Interface

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS submitted Job Status UI: позволяет пользователям получить доступ к функциональности WMS (CLI, GUI, C++ и Java APIs)

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorG Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS submitted Job Status edg-job-submit myjob.jdl myjob.jdl JobType = Normal; Executable = "$(CMS)/exe/sum.exe"; InputSandbox = {"/home/user/WP1testC","/home/file*, "/home/user/DATA/*"}; OutputSandbox = {sim.err, test.out, sim.log"}; Requirements = other. GlueHostOperatingSystemName == linux" && other.GlueCEPolicyMaxWallClockTime > 10000; Rank = other.GlueCEStateFreeCPUs; Job Description Language (JDL) определяет характеристики и требования задания

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status Задание Файлы из Input Sandbox NS: сетевой сервис, ответственный за прием входных запросов RB storage

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status WM: ответственен за выполнение действий для удовлетворения запроса RB storage

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status RB storage Где должно выполняться это задание ? Match- Maker/ Broker

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status RB storage Match- Maker/ Broker Matchmaker: отвечает за поиск лучшего CE, где будет выполняться задание

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status RB storage Match- Maker/ Broker Где (на каком SE), необходимые данные? Какой статус у Грид-ресурсов

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status RB storage Match- Maker/ Broker Выбор CE

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorG Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS waiting submitted Job Status RB storage Job Adapter JA: ответственен за окончательнуюдоводку задания перед процедурой запуска (напр. создание wrapper скрипта, и т.п.)

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Computing Element Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS Job Status RB storage JC: ответственен за операции управления заданием (через CondorC) submitted waiting ready

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Storage Element RB узел Характеристики. и статус CE Характеристики и статус SE Information Service RLS Job Status RB storage Задание submitted waiting ready scheduled CE получает запрос и посылает задание на выполнение LRMS Файлы из Input Sandbox Computing Element

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Storage Element RB узел Доступ к данным через Грид Information Service RLS Job Status RB storage LRMS управляет выполнением задания Computing Element submitted waiting ready scheduled running

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Storage Element RB узел Information Service RLS Job Status Computing Element submitted waiting ready scheduled running done Файлы из Output Sandbox RB storage

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Storage Element RB узел Information Service RLS Job Status Computing Element submitted waiting ready scheduled running done RB storage edg-job-get-output

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания UI Network Server Job Contr. - CondorC Workload Manager Storage Element RB узел Information Service RLS Job Status Computing Element RB storage submitted waiting ready scheduled running done submitted waiting ready scheduled running done cleared Файлы из Output Sandbox

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Практическая часть

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Создание proxy сертификата Перед началом работы создаём proxy сертификат grid-proxy-init При этом нужно будет ввести пароль, которым защищён сертификат. По умолчанию время жизни такого сертификата равно 12 часам. > grid-proxy-init Your identity: /C=RU/O=RDIG/OU=users/OU=pnpi.nw.ru/CN=Elena Martinova Enter GRID pass phrase for this identity: Creating proxy Done Your proxy is valid until: Sat Nov 11 01:53: Для получения информации о proxy-сертификате можно воспользоваться следующей командой: grid-proxy-info –all > grid-proxy-info -all subject : /C=RU/O=RDIG/OU=users/OU=pnpi.nw.ru/CN=Elena Martinova/CN=proxy issuer : /C=RU/O=RDIG/OU=users/OU=pnpi.nw.ru/CN=Elena Martinova identity : /C=RU/O=RDIG/OU=users/OU=pnpi.nw.ru/CN=Elena Martinova type : full legacy globus proxy strength : 512 bits path : /tmp/x509up_u10032 timeleft : 11:59:21

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Удаление proxy сертификата По окончании сеанса работы рекомендуется уничтожить proxy сертификат grid-proxy-destroy

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 1 Есть программа на PERL tstp.pl, которая использует входной файл c колонкой чисел. Каждое число возводится в квадрат и записывается в выходной файл. Имя входного файла передается как параметр программы. Имя выходного файла то же как и входного, но с расширением out.

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 1 (PERL файл) PERL файл: #!/usr/bin/perl -w my $inpf=$ARGV[0]; $inpf=~/(.*)\./; my $outf=$1.'.out'; open(INP,"$inpf"); open(OUT,">$outf"); while (my $s= ){ $s*=$s; print(OUT "$s\n"); }; close(INP); close(OUT);

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 1 (JDL файл) JDL файл: VirtualOrganisation = "nw_ru"; Executable = tstp.pl"; Arguments = tstp.inp"; StdOutput = "std.out"; StdError = "std.err"; InputSandbox={tstp.pl",tstp.inp"}; OutputSandbox = {"std.out", "std.err",tstp.out"}; RetryCount = 3;

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 1 (INP файл) INP файл:

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Просмотр доступных ресурсов edg-job-list-match --vo - список доступных ресурсов, удовлетворяющих требованиям задания - match making без реального запуска задания >edg-job-list-match tstp.jdl Selected Virtual Organisation name (from JDL): nw_ru Connecting to host cluster.pnpi.nw.ru, port 7772 *************************************************************************** COMPUTING ELEMENT IDs LIST The following CE(s) matching your job requirements have been found: *CEId* grid.scc.ioffe.ru:2119/jobmanager-pbs-nw_ru grid.spiiras.nw.ru:2119/jobmanager-pbs-nw_ru cluster.pnpi.nw.ru:2119/jobmanager-pbs-nw_ru ***************************************************************************

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания edg-job-submit [-r ] [--vo ] [-o ] -r задание будет послано на определённый CE, идентифицируемый как --vo название Виртуальной Организации (если не определено ранее в конфигурационном файле или JDL файле) -o идентификатор задания (jobid) будет сохранён в файле Полезно для дальнейших команд, например: edg-job-status –i (или jobid) -i означает, что jobid содержится в файле

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Запуск задания 1 >edg-job-submit -o myid tstp.jdl Selected Virtual Organisation name (from JDL): nw_ru Connecting to host cluster.pnpi.nw.ru, port 7772 Logging to host cluster.pnpi.nw.ru, port 9002 ================= edg-job-submit Success ================================== The job has been successfully submitted to the Network Server. Use edg-job-status command to check job current status. Your job identifier (edg_jobId) is: - The edg_jobId has been saved in the following file: /home/elm/tut/task1/myid =====================================================================

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Просмотр статуса задания edg-job-status [-i ] -i идентификатор задания (jobid) будет браться из файла > edg-job-status -i myid ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : Current Status: Done (Success) Exit code: 0 Status Reason: Job terminated successfully Destination: grid.scc.ioffe.ru:2119/jobmanager-pbs-nw_ru reached on: Fri Nov 10 14:01: *************************************************************

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Получение выходных файлов Когда задание завершилось (статус Done), файлы, указанные в атрибуте OutputSandbox могут быть переданы на UI, с которого было запущено задание. edg-job-get-output [--dir ] [-i ] -i идентификатор задания (jobid) будет браться из файла --dir файлы из OutputSandbox будут сохранены в директории >edg-job-get-output --dir. -i myid Retrieving files from host: cluster.pnpi.nw.ru ( for ) ********************************************************************************* JOB GET OUTPUT OUTCOME Output sandbox files for the job: - have been successfully retrieved and stored in the directory: /home/elm/tut/task1/elm_1t1_M2yCcm1FZu2XEbzEzg *********************************************************************************

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Завершение задания edg-job-cancel [-i ] >edg-job-cancel -i myid Are you sure you want to remove specified job(s)? [y/n]n :y ============================= edg-job-cancel Success ============================== The cancellation request has been successfully submitted for the following job(s): - ==============================================================================

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Результат После завершения работы команды edg-get-output в текущей директории пользователя будет создана директория, в которую скопируются 3 файла. –std.err –std.out –tstp.out Содержимое выходного файла с результатами счёта: $ cat tstp.out

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 2 Есть файл с исходным текстом программы на языке С ctst.c, которая выводит строку Hello world на стандартный вывод. Есть Makefile для сборки этой программы. Необходимо обеспечит сборку и запуск программы на удаленном ресурсе.

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 2 (JDL файл) JDL файл: JobType="Normal"; VirtualOrganisation = "nw_ru"; Executable = "startC.sh"; StdOutput = "ctst.out"; StdError = "ctst.err"; OutputSandbox = {"ctst.out","ctst.err"}; InputSandbox = {"startC.sh","ctst.c","Makefile"}; RetryCount=3;

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 2 (скрипт) Cтартовый скрипт startC.sh: #!/bin/bash make //сборка программы chmod +x ctst //разрешаем запускать ее./ctst //запускаем exit 0

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 2 (С файл) Текст программы на С - ctst.c: #include int main(int argc, char **argv) { char *name = argv[1]; printf("\n\n\n"); printf("Hello world!\n"); printf("\n\n\n"); // exit(0); }

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 2 (Makefile) Makefile ctst: ctst.o g++ ctst.o -o ctst -lm clean: rm ctst.o ctst

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 3 Есть файл со скриптом, который генерит набор JDL файлов, количество которых определяется входным параметром Затем для каждого задания случайным образом выбираются слова из системного словаря /usr/share/dict/words, которые передаются, как аргументы для каждого из запускаемых заданий. Все задания запускаются и контролируется процесс их выполнения. После завершения всех заданий (успешного или нет) – выводится результат.

Enabling Grids for E-sciencE EGEE-II INFSO-RI Saint-Petersburg, EGEE tutorial, Пример задания 3 Файл echoword.sh #!/bin/bash echo "Word $1 is $2"; Запуск задания./submit-dictionary-jobs.sh 3