Современная система мониторинга и управления ИТ - инфраструктурой 2011 г. от компании BMC Software
О фирме Pronet Основана в 1997 году Более 170 специалистов в различных регионах Законченные проекты, отмеченные наградами Высококвалифицированный персонал Процессно-ориентированное управление проектами Партнерские отношения с различными вендорами Консалтинговые услуги
Тренды сов. систем мониторинга 3 Смена реактивного мониторинга на проактивный; Средства прогнозирования аварий и самообучения; Удобство и простота (установка, экспл., поддержка); Выявление корневых причин (root case); Использование CMDB, РСМ, продуктов авт. ITSM; Готовые средства интеграции с различными ИС; Динамические пороги, профилей поведения ОМ; Гибкая корреляция событий, интеллектуальное подавление «шума», предсказание поведения ОМ; Наличие готовых workflow для определенных ОМ, событий. ОМ – объект мониторинга ИС – Информационные Системы
Требования к системам мониторинга 4 Наглядное представление о качестве работы ИТ- инфраструктуры и ключевых БУ; Сокращение времени восстановления работы БС; Оценка качества предоставляемых услуг (SLA); Работа со всеми типами ИТ-инфраструктуры; Расчет не только KPI, но и Health Indicators (понятных для бизнес-пользователей); Имитация проверок работы БУ со стороны конечного пользователя; Приоритезация для критичных инцидентов; Повышение эффективности работы персонала; Способность работать в изменяющейся ИТ среде. БУ – бизнес услуга
ПО предлагаемое нами для мониторинга 5 BMC ProactiveNet Performance Management (BPPM) BMC AppSight Application Problem Resolution BMC Transaction Management ART BMC Performance Manager (Portal) BMC Performance Manager (PATROL) BMC BladeLogic Configuration for Servers CA Spectrum Network Fault Manager Suite CA UniCenter
6 Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic, Real) Agent/KM & Agentless (System, Application, DB, Network, Storage, MF) 3rd Party (HP, CA, IBM, VMware, MSFT, SAP, etc.) Business KPI Performance Management Database BMC Remedy Incident, Problem& Change Mgt AlarmPoint BMC BladeLogic Automation BMC Atrium Orchestrator BMC Atrium CMDB BMC ADDM Интеллектуальная аналитика Выявление Root Cause Оценка аварий на сервисы Динамические профили Упреждающая корреляция Deep App Diagnostics Функциональная схема системы (BPPM)
Hardware Management –IBM, HP, Dell, Sun, Fujitsu-Siemens, NEC, Adaptec –HP Insight Manager –Dell OpenManage –Storage devices (NetApp) –Power Monitoring –High Availability & Backup Tools Server Management –IBM AIX, HP-UX, Sun Solaris –Red Hat Linux, SUSE Linux, Oracle Enterprise Linux –Microsoft Windows/XP/Vista/Active Directory –IBM iSeries, HP OpenVMS Virtual Server Management –AIX LPAR/WPAR –Citrix XenServer (new in 8.x) –HP UX nPar/vPar/VM Host/VM Guest –Microsoft Hyper-V –Sun Solaris Zones/Containers and Logical Domains –VMWare (vCenter, ESX, ESXi) Application Management –Citrix (Metaframe, Presentation Server, WTS) –Microsoft Exchange, Lotus Domino –SAP (NetWeaver, Enterprise Portal, R/3, CRM, SCM, BW, Web App) –Oracle Fusion, Oracle eBusiness, Siebel, PeopleSoft –Microsoft SharePoint –High Availability & Backup Deep Application Diagnostics –Oracle (BEA) WebLogic –IBM WebSphere –Tomcat –Jboss Web Servers –Apache, Tomcat & Generic J2EE Web Servers –IIS (Apache, Microsoft, Netscape, SendMail, Bind DNS) App Servers –IBM WebSphere Application Server –Oracle/BEA WebLogic Server –Oracle Application Server –SunOne, ATG Dynamo, Jboss Web App Servers Middleware –BEA Tuxedo –IBM WebSphere MQ (MSM) Database Management –Oracle –Microsoft SQL Server –Sybase –DB2 Universal Database –Informix –MySQL Network Management –VPN/Firewall-1, Checkpoint, NG –Network devices (SNMP-based) Мониторинг инфраструктуры (out-of-box)
8 Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic, Real) Agent/KM & Agentless (System, Application, DB, Network, Storage, MF) 3rd Party (HP, CA, IBM, VMware, MSFT, SAP, etc.) Business KPI Performance Management Database BMC Remedy Incident, Problem& Change Mgt AlarmPoint BMC BladeLogic Automation BMC Atrium Orchestrator BMC Atrium CMDB BMC ADDM Интеллектуальная аналитика Выявление Root Cause Оценка аварий на сервисы Динамические профили Упреждающая корреляция Deep App Diagnostics Функциональная схема системы (BPPM)
9 Синтетическая аналитика
Мониторинг транзакций 10 Веб браузер HTTP(S)/HTML Macromedia Flex/AMF Streaming (MS, Real) Outlook Web Access Веб браузер HTTP(S)/HTML Macromedia Flex/AMF Streaming (MS, Real) Outlook Web Access Протоколы HTTP(S) SMTP/POP/IMAP MAPI FTP LDAP WAP/MMS & Radius TCP/IP & UDP Протоколы HTTP(S) SMTP/POP/IMAP MAPI FTP LDAP WAP/MMS & Radius TCP/IP & UDP Связующее ПО CORBA (IIOP) J2EE/EJB.NET Remoting (Framework) (D)COM (COM+, MTS) BEA Tuxedo (ATMI, JOLT) Oracle Forms SAP NetWeaver Связующее ПО CORBA (IIOP) J2EE/EJB.NET Remoting (Framework) (D)COM (COM+, MTS) BEA Tuxedo (ATMI, JOLT) Oracle Forms SAP NetWeaver Терминальные сервисы Citrix MetaFrame (ICA) Терминальные сервисы Citrix MetaFrame (ICA) Клиент/Сервер (базы данных) ODBC ADO Oracle OCI IBM CLI Клиент/Сервер (базы данных) ODBC ADO Oracle OCI IBM CLI ERP/CRM SAP PeopleSoft Siebel Oracle Applications Chordiant E.piphany Lawson ERP/CRM SAP PeopleSoft Siebel Oracle Applications Chordiant E.piphany Lawson Другие приложения Windows GUI Support Другие приложения Windows GUI Support Веб сервисы (SOA) SOAP (HTTP/XML) MS.NET SOAP Stack Apache Java SOAP Stack Веб сервисы (SOA) SOAP (HTTP/XML) MS.NET SOAP Stack Apache Java SOAP Stack Legacy/Mainframe IBM Mainframe (TN3270e) Telnet-based terminal protocol 5250 Legacy/Mainframe IBM Mainframe (TN3270e) Telnet-based terminal protocol 5250
11 Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic, Real) Agent/KM & Agentless (System, Application, DB, Network, Storage, MF) 3rd Party (HP, CA, IBM, VMware, MSFT, SAP, etc.) Business KPI Performance Management Database BMC Remedy Incident, Problem& Change Mgt AlarmPoint BMC BladeLogic Automation BMC Atrium Orchestrator BMC Atrium CMDB BMC ADDM Интеллектуальная аналитика Выявление Root Cause Оценка аварий на сервисы Динамические профили Упреждающая Корреляция Deep App Diagnostics Функциональная схема системы (BPPM)
Upper Baseline Lower Baseline Normal Behavior ? $ Динамические пороги
13 Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic, Real) Agent/KM & Agentless (System, Application, DB, Network, Storage, MF) 3rd Party (HP, CA, IBM, VMware, MSFT, SAP, etc.) Business KPI Performance Management Database BMC Remedy Incident, Problem& Change Mgt AlarmPoint BMC BladeLogic Automation BMC Atrium Orchestrator BMC Atrium CMDB BMC ADDM Интеллектуальная аналитика Выявление root case Оценка аварий на сервисы Динамические профили Упреждающая корреляция Deep App Diagnostics Функциональная схема системы (BPPM)
14 Механизмы определения Правила обработки Корреляция событий
Упреждающие события 15 Фильтр по не типичному поведению, авариям и прогнозированным событиям
Механизмы обработки событий 16 События Мощные встроенные функции: – Фильтрация, корреляция и обогащение событий; – Возможность интеграции с внешними данными и приложениями; – Timer mechanism; – Автоматизация реакций на события и предупреждающие действия. Прерывание обработки событий на любом этапе: – Упрощает обработку; – Улучшает производительность. Настройка с использованием: – Dynamic Event Management policies для большинства ситуаций – Master Rule Language [MRL] для специфичных сценариев обработки.
Сбор событий от систем: – CA UniCenter® TNG – HP-OpenView Network Node Manager – HP-OpenView Operations – IBM NetCool Omnibus – Microsoft® MOM/SCOM – Tivoli® TEC – CA Spectrum – EMC SMARTS (Ionix) – HP NNMi – RSA enVision – Solarwinds Orion NPM – VMware (vCenter, ESX, ESXi) Передача событий в системы: – CA UniCenter® TNG – Microsoft® MOM/SCOM – HP Service Manager – HP OpenView Network Node Manager – HP OpenView Operations – Tivoli® TEC – Databases Средства интеграции событий: - SNMP - Log-files - TCP/UDP client/server - Telnet adapter - Windows Event Log - Command line - C API (iiSDK)* Client and server API - Web Services API* Client and server API * Двунаправленная интеграция – продукты BMC могут отправлять и принимать события Интеграция событий
Определение корневой причины Сервер приложений работает медленно из-за выполнения ряда транзакций
19 Консоль управления События и показатели производительности Мониторинг End User Experience (Synthetic, Real) Agent/KM & Agentless (System, Application, DB, Network, Storage, MF) 3rd Party (HP, CA, IBM, VMware, MSFT, SAP, etc.) Business KPI Performance Management Database BMC Remedy Incident, Problem& Change Mgt AlarmPoint BMC BladeLogic Automation BMC Atrium Orchestrator BMC Atrium CMDB BMC ADDM Интеллектуальная аналитика Выявление Root Cause Оценка аварий на сервисы Динамические профили Упреждающая корреляция Deep App Diagnostics Функциональная схема системы (BPPM)
Нарушенный KPI сервиса – время выполнения транзакции Графическое представление для KPI – выявленный тренд Drill-down в корневую-причину для детального анализа выявленного тренда
21 Приоритезация событий основанная на влиянии для бизнес-процессов Интеграция оценки влияния событий с автоматизацией по их обработке Отображение физических, виртуальных и облачных служб Оценка влияния событий для бизнеса
Приоритезация событий 22
Автоматизация корректирующих действий 23 Сбор дополнительной диагностики и обогащение событий Стандартная архитектура автоматизации инициации инцидента и изменения управления процессом Выполнение стандартизированной сортировки и восстановление задач
Workflows – Manual or Automatic execution – Customizable Disk Full – Free up disk space when disk full condition occurs – Create Incident if disk full (if deployed) – Initiate Change Request Workflow (if deployed) Host Down – Verify host down (uses various methods like ping and traceroute) vs. network connectivity issue – ITIL 360 degree verification – Create Incident if host not available (if deployed) ESX Host Down (Variation of Host Down) – Restart ESX services if verify ESX host down (vs physical host down vs. network connectivity issue) Failed Tivoli Storage Manager Backup Job (coming in 3.0) – Restart failed TSM backup job – Create Incident if TSM backup job failed Примеры готовых Workflows
Динамические dashboards 25 Консоль выполнения мониторинга в реальном времени и управленческая консоль End to End Service Views – функции, процессы и инструменты Сфокусированное управление KPI Определение тенденций поддержки бизнес - услуг
Мониторинг и Service Desk 26 Intelligent Incident BMC Remedy Service DeskBMC Proactive Operations Console Взаимосвязь операций и процессов в соответствии с ITIL Отправка в BMC Remedy Service Desk: Информ. о root-case непосредственно в BMC Remedy Service Desk Отслеживание MTTR, обеспечение уровня обслуживания Интеллектуального инцидента с детальной диагностикой и причиной Оповещения с прогнозом для своевременного уведомления пользователя
BMC Atrium CMDB 27
– Поддержка виртуальной среды (clouds) – Автоматизация упреждающих и других типовых операций/действий – Интеграция с CMDB (out-of-box) – РСМ храниться в CMDB – Интеграция с решениями по автоматизации ITSM – Консолидированная отчетность (с ITSM) – Масштабируемость – Средства самообучения при работе с ОМ – Единый интерфейс пользователя Другие отличительные черты
Proactively detect capacity issues (excessive motions) Generate Accurate Root Cause & Service Impact Populate Real-Time Enterprise Service Models with dynamic virtual & physical relationships Retain baselines to match dynamic virtual & private cloud environments Instantly correlate performance with motions (changes) Virtual Server Virtual Server Dynamic Virtualization & Cloud Analytics Increase MTBF in Virtual Environments
Регистрация и обработка в многопользовательском режиме информации о качестве работы ИС в централизованном хранилище; Автоматизированный контроль ОМ; Прогнозируемость работы ИТ и эффективные средства контроля и управления; Возможность автоматического выполнения заданных действий для определенных инцидентов; Повышение качества и доступности ресурсов; Унификация технических средств мониторинга; Интеграция системы мониторинга с другими ИС, в т.ч. и с средствами автоматизации процессов ITSM. 30 Результаты по внедрению проектов ИС – Информационные Системы
Анализ вероятных корневых причин нарушения KPI по сервису Оценка для обнаруженных событий Внешние сетевые события Application, Database, Web Server Intelligent Data Events События по работе ИС События по конфигурации КЕ
Детальная диагностика – список процессов и использование CPU Детализация для выявленного события по загрузке CPU, который обслуживает ORACLE
Группировка объектов по устройствам Группировка всех КЕ в спец. дашборды
Группировка объектов по устройствам
Нарушенный KPI сервиса – время выполнения транзакции Графическое представление для KPI – выявление трендов Drill-down для проведения поиска причин при выявлении тренда для KPI
Детальная информация о состоянии сервиса Значения метрик для искомого KPI Drill-down из предыдущего слайда по поиску событий, которые привели к тренду для KPI
Детальная информация о нарушенных KPI для сервиса Drill-down from the KPIs associated with the service
ВОПРОСЫ ? Эл. адрес для дополнительных вопросов Спасибо за внимание