Управление отказами в распределённых АСТУ Научный руководитель: к. ф.-м. н. Ковалёв С.П. Новосибирский государственный университет Факультет информационных технологий Кафедра общей информатики
2 Управление отказами Система управления отказами включает: 1. Обнаружение неисправности 2. Регистрацию неисправности в журнале 3. Уведомление ответственного персонала 4. Автоматическое устранение (если это возможно) Цель: Обеспечить выполнение системой функций по ее прямому назначению.
3 Тестирование и мониторинг Мониторинг это специально организованное, систематическое наблюдение за состоянием объектов, процессов с целью их оценки, контроля или прогноза. Тестирование: Тестирование конфигурации системы Тестирование каналов связи Модульное (unit) тестирование И другие виды тестирования на разных этапах ЖЦ системы В данном докладе мы сосредоточим наше внимание на обеспечении мониторинга
4 Мониторинг крупных систем Средства мониторинга не обеспечивают достаточный уровень автономности и плохо интегрируются в крупную систему Решение данной проблемы от IBM (IBM Autonomic Computing Toolkit) практически не пригодно для повторного использования Система мониторинга представляется одной из важнейших составляющих распределённой системы.
5 Регистрация и анализ событий
6 Секционирование ЕТЖ (partitioning)
7 Таблицы временных данных
8 Кодирование событий и ресурсов
9 Оповещение персонала
10 Вопросы? Более подробно: Кузнецов А.А., Ковалёв С.П., Тестирование и мониторинг в распределённых автоматизированных системах технологического управления. Журнал «Вычислительные Технологии» (в печати) В Интернете уже сейчас: