Методы обеспечения отказоустойчивости Exchange 2003 Андрей Пономарев Сергей Халяпин
Аннотация (скрытый слайд) Будут даны понятия стоимости простоя и анализа рисков, понятия доступности и способов защиты от сбоев. Будут продемонстрированы примеры технологий защиты от сбоев. Будет рассказано о планирование кластеров Exchange 2003, их преимущества и ограничения, описаны некоторые особенности кластеров. Будут даны рекомендации по планирование дисковой подсистемы Exchange Принципы и способы построения дисковой подсистемы, рассказано о практических примерах развертывания дисковых хранилищ. Будет затронута тема контроля и мониторинга почтовых систем. Будут описаны и продемонстрированы методы восстановления после сбоев.
Содержание Понятие доступности Понятия стоимости простоя Типы сбоев Примеры технологий защиты от сбоев Понятие кластерных технологий Системы контроля и мониторинга Методы восстановления Демонстрация Заключение
Понятие доступности Процент доступности Время простоя в год при 24-часовом рабочем дне 8-часовом рабочем дне 90%876 часов291,2 часов 95%438 часов145,6 99%87,6 часов29,12 часов 99,9%8,76 часов2,91 часа 99,99%52,56 минут17,47 минут 99,999%5,256 минут1,747 минут 99,9999%31,536 секунды10,483 секунды % доступности = (суммарное рабочее время– общее время простоя)/суммарное рабочее время
Понятие стоимости простоя Снижение производительности Снижение прибыли Снижение финансовой активности Снижение доверия Дополнительные затраты И др.
Типы сбоев Сбой системы хранения данных Сбой ЛВС Сбои компонентов ОС Сбои серверов Сбой при обслуживании Природные катаклизмы
Технологии защиты от сбоев Защита Back-End серверов Кластер Geo кластер Гибридный кластер Dial-tone Защита Front-End серверов NLB кластер
Защита Front-End серверов Обеспечивает отказоустойчивость Обеспечивает распределение нагрузки Даёт возможность использовать географически распределенные узлы
Защита Back-End серверов Восстановление работоспособности при: повреждении базы повреждении почтового ящика повреждении сервера повреждении Центра Обработки Данных (ЦОД)
Понятие кластерных технологий Что такое кластеры Exchange 2003 Планирование кластеров Exchange 2003 Преимущества и ограничения кластеров Особенности кластеров Exchange 2003
Кластеры Exchange 2003 С Windows 2003 / Exchange 2003 SP1 Кластеризация до 8 узлов Возможна поддержка до 7 активных и 1 пассивного узла Улучшенное управление памятью Улучшения в Active Directory Проверка схемы во время установки с возможностью отмены изменений Сокращение трафика репликации > 5000 пользователей в группе
Кластеры Exchange 2003 (продолжение) Улучшенное время восстановления кластера Улучшенная репликация Public Folder Мгновенный снимок/архив VSS Типы восстановления кластера Exchange 2003 Восстановление ресурса разделенного диска Восстановление ресурса - кворума Замена поврежденного узла Восстановление всего кластера Exchange 2003
Кластеры Exchange 2003 (новое) Majority Node Set (MNS) кластер Automated System Recovery кластеров Встроенная поддержка обновления на Windows Server 2003 Поддержка точек монтирования файловой системы
MNS кластер Когда применяется данное решение: Географически распределенные кластеры Недорогие решения, требующие высокой доступности Расчет = (Количество узлов в кластере / 2) + 1
Системы контроля и мониторинга Утилиты мониторинга Exchange 2003 Встроенные системные утилиты ExBPA, ExDRA, ExPTA и др. Microsoft Operation Manager 2005 Утилиты сторонних разработчиков (HP, IBM и др.)
Построение отказоустойчивой инфраструктуры
Восстановление сервера Восстановление физического сервера – 1-2 часа Восстановление ОС, Exchange, установка SP + HotFix – 2-3 часа Восстановление резервной копии – от 1 до 10 часов Применение файлов транзакций – примерно 2 Гб/час Итого: от 5 до 20 и более часов Защищает при: Необходима полная стадия восстановления при любых типах сбоев
Восстановление узла кластера Перемещение виртуального сервера на другой узел - до 5 минут Итого: до 5 минут Защищает при : Сбоях аппаратной части
Восстановление по методу Dial-Tone Восстановление на «запасной» сервер из клонированной копии – минут Создание dial-tone базы – 5 минут Монтирование резервной копии – 5 минут Применение файлов транзакций – примерно 2 Гб/час Итого: от 30 минут до 2 часов
Восстановление по методу Dial-Tone (продолжение) Защищает при: Сбоях аппаратной части Сбоях ЦОД Сбоях базы данных Сбоях ЛВС
Восстановление при синхронном копировании узлов Восстановление на «запасной» сервер из клона – минут Монтирование резервной копии – 5 минут Применение файлов транзакций – примерно 2 Гб/час Итого: до 2 часов Защищает при: Сбоях аппаратной части Сбоях ЦОД Сбоях ЛВС
Восстановление бездискового сервера (загрузка SAN) Создание нового сервера из клона – минут Итого: минут Защищает при: Сбоях аппаратной части Сбоях ЦОД Сбоях ЛВС
Восстановление узла GEO кластера Локальное перемещение на другой узел - до 5 минут Перемещение на удаленный узел - до 10 минут Итого: минут Защищает при: Сбоях аппаратной части Сбоях ЦОД Сбоях ЛВС
Восстановление узла гибридного кластера Перемещение на другой узел – до 5 минут Восстановление на «запасной» удаленный сервер из клонированной копии – до 30 минут Итого: 5-30 минут Защищает при: Сбоях аппаратной части Сбоях базы данных Сбоях ЦОД Сбоях ЛВС
Степени защиты от сбоев СБОЙ СЕРВЕРА СБОЙ ЦОД СБОЙ БАЗЫ ДАННЫХ СЕТЕВЫЕ СБОИ Выделенный сервер xxx DIAL-TONE система xxxx Синхрон. данных xxx Выделенный кластер x Бездисковый кластер (SAN) xxx GEO кластер xxx Гибридный кластер xxxx
демо
Итоги Кластеризация – хорошее решение для восстановления Exchange после сбоев, но это только один из возможных вариантов защиты информации. Необходимо соразмерять затраты на восстановление со стоимостью простоя или потери информации для достижения наиболее оптимальных значений. Методы и решения должны быть адекватны произошедшему сбою. Понимание того, как создаются и восстанавливаются базы данных Exchange помогает правильно спланировать и внедрить систему восстановления сервера Exchange
Вопросы? В течение часа после доклада эксперты компании будут присутствовать на стенде Спроси эксперта