Мониторинг в Mail.Ru Group Лихобабин Сергей Руководитель отдела внутренней разработки.

Презентация:



Advertisements
Похожие презентации
Построение системы мониторинга информационной среды Грунау Андрей Борисович 20/02/08
Advertisements

Yet another object level permissions Сергей Лихобабин Руководитель отдела внутренней разработки.
Система мониторинга на уровне ЛПУ Удаленные рабочие столы АСУ учета заявок пользователей.
ENGLER Monitoring Круглосуточный контроль за работоспособностью ваших сайтов и серверов.
DATASPHERE Activity Monitor. Факт: С каждым днем сложность ИТ-ландшафта стремительно возрастает Распределенные приложения и процессы Activity Monitor.
Введение системы сбалансированных показателей в образовательном процессе.
Интернет Контроль Сервер Интернет Контроль Сервер (ИКС) - это готовый программный Интернет шлюз с огромным набором функций для решения всех задач взаимодействия.
УДАЛЕННОЕ УПРАВЛЕНИЕ М2М-УСТРОЙСТВАМИ ВАШЕЙ КОМПАНИИ М2М-МЕНЕДЖЕР.
SLA-ON Сервер Больше чем просто мониторинг. SLA-ON Сервер.
Обзор ПК ГеКон (ТУБР) Версия ПК ГеКон - составная часть АС БР В презентации представлены основные направления развития автоматизированной системы.
Антивирус Касперского® Personal Pro. Антивирус Касперского® 5.0 Personal Pro Интерфейс пользователя Простой графический интерфейс с минимально необходимым.
«Облачные» решения для управления SIM-картами Разработано Dinstar Technologies.
НАСТОЙКА МЕХАНИЗМОВ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ СЕРВЕРОВ ЭЛЕКТРОННОЙ ПОЧТЫ.
ITIL Анастасия Крючкова ООО « ИнфраМенеджер » Управляющий партнер.
Мониторинг каналов связи, (С) ProLAN, 2010 Мониторинг и диагностика MPLS сети.
Kaspersky® SMTP- Gateway 5.5 for Linux/UNIX. Kaspersky® SMTP- Gateway - что это такое? Решение, предназначенное для антивирусной обработки почтовых сообщений,
Мобильное приложение для сайтов и интернет-магазинов.
Веб-кластер, планы по развитию, распределенный веб-кластер Максим Смирнов ведущий разработчик.
1 «1 С-Битрикс: Интерактивная карта объектов» для разработчиков: сценарии использования и тонкости настройки.
Инструментальная система разработки распределенных приложений «SiTex»
Транксрипт:

Мониторинг в Mail.Ru Group Лихобабин Сергей Руководитель отдела внутренней разработки

Зачем нужен мониторинг? Мы хотим быть в курсе: Если что-то сломалось Если что-то скоро сломается Если что-то ломается часто

Платформа мониторинга Mail.Ru Group Как устроена? Почему не готовое решение? Почему платформа?

Немного статистики Более 20 тысяч хостов Более 50 тысяч событий за день Более 820 тысяч проверяемых параметров

Почему не готовое решение? Скорость Гибкость Интеграция c другими сервисами

Что проверяем? Оборудование Производительность Безопасность Сетевая связность и параметры сети Логика приложений

Что проверяем: Оборудование Температура Параметры ИБП

Что проверяем: Безопасность Уязвимые версии пакетов Автоматические сканы уязвимостей Проверки пользователей и ключей на машинах

Что проверяем: Производительность Graphite Север-side Client-side Slow Query log анализ Отставания репликации

Что проверяем: Бизнес-логика Паттерны в логах Проверяем пользовательские сценарии Генерация инцидентов приложением

Что проверяем: Сетевая связность DNS Резолвинг из разных точек IPv4 и IPv6 Закрытость служебных сервисов извне

Архитектура мониторинга Отсутствие единой точки отказа Распределенные демоны активного мониторинга Мониторинг as a service

Архитектура мониторинга

Демоны активного мониторинга Проверки статуса систем (PING, SNMP, TCP, DNS) Проверки приложений (HTTP, DNS, SMTP и др.) Асинхронный опрос Простая инициализация новых инстансов

Мониторинг as a service Агрегация инцидентов Прием сообщений из других систем мониторинга, специфичных для проектов Простой REST интерфейс

API мониторинга Максимально простая реализация со стороны клиента Оптимизированная отправка ОК статусов Идентификация клиентов мониторингом

Интеграция с внутренними системами Централизованная авторизация Интеграция с таск-трекером(Jira) Интеграция с 1С (закупки железа) Интеграция с внутренним порталом(отпуска) Мониторинг базовых параметров при заведении сервера в инвентаре

Интеграция в процессы Простейший таск-трекер Иерархии ответственности История событий и действий Автоматические уведомления и дежурные

Гибкие уведомления Настраиваемые условные уведомления Уведомление при превышении порога в группе серверов Зависимость от времени суток, дня недели, графика дежурств

SLA Время реакции на проблему Количество проблем в зоне ответственности Среднее время решения

Мониторинг мониторинга Отслеживание «живучести» демонов Проверки из разных ДЦ Создание событий мониторинге о проблемах в мониторинге

Спасибо за внимание