Урок 1. Платформа Виртуализация Майкрософт для специалистов VMware Модуль 4. Высокая доступность и кластеризация Саймон Перриман (Symon Perriman) и Кори Хайнс (Corey Hynes)
План Урок 1. Платформа – Модуль 1. Общие сведения о виртуализации – Модуль 2. Отличия решений Майкрософт и компании VMware – Модуль 3. Архитектура и параметры развертывания Hyper-V – Модуль 4. Высокая доступность и кластеризация Урок 2. Управление – Модуль 5. Общие сведения о наборе приложений System Center и DPM – Модуль 6. Автоматизация с помощью System Center Opalis и PowerShell – Модуль 7. Virtual Machine Manager 2012 – Модуль 8. Частные облачные решения, архитектура и VMM SSP 2.0 Урок 3. Инфраструктура виртуальных рабочих столов (VDI) – Модуль 9. Часть 1. Архитектура VDI – Модуль 10. Часть 2. Архитектура VDI – Модуль 11. Общие сведения о решении v-Alliance – Модуль 12. Доставка приложений для VDI
Высокая доступность и кластеризация План – Общие сведения о высокой доступности – Требования к программному обеспечению и оборудованию – Развертывание кластера – Высокая доступность Hyper-V – Аварийное восстановление Цели модуля – Получение общего представления об интеграции и масштабировании Hyper-V – Знакомство с требованиями к программному обеспечению и оборудованию – Знакомство с возможностями гибкого развертывания и управления – Понимание важности автоматического аварийного восстановления
Отказоустойчивая кластеризация и Hyper-V Основной компонент инфраструктуры частного облака – Высокая доступность – Масштабируемость – Мобильность виртуальных машин Поддержание работоспособности виртуальных машин – Определение работоспособности оборудования – Определение работоспособности ОС узла – Определение работоспособности виртуальной машины – Определение работоспособности приложения или службы – Автоматическое восстановление
Модуль 4. Высокая доступность и кластеризация Общие сведения о высокой доступности
Процент времени работоспособности (%) Время простоя за год 99,999 («Пять девяток» )5 минут 99,9952 минуты 99,98,7 часов 993,7 дней Что такое высокая доступность? Глобальный рынок работает в круглосуточном режиме Системы должны работать непрерывно Цель высокой доступности поддержание непрерывной работоспособности систем, приложений, служб, электронной почты, баз данных, файлов и принтеров У каждой организации свои потребности в высокой доступности
Почему высокая доступность является важной? Простой сервера является неизбежным Поддерживайте непрерывную работу и конкурентоспособность бизнеса Причины простоя сервера – Обслуживание – Обновление оборудования – Установка обновлений – Пакеты исправлений, программное обеспечение, встроенное ПО – Несчастные случаи – Отключение электроэнергии – Аварии Начните планировать высокую доступность прямо сейчас
Отказоустойчивая кластеризация 101 Более 2 компьютеров и обеспечение избыточности на каждом участке На каждом узле можно расположить более 1 приложения высокой доступности или службы Благодаря базе данных кластера каждый узел располагает сведениями о содержимом других узлов База данных кластера реплицируется на все узлы Общее хранилище сети SAN доступно всем узлам Данные приложений записываются в общее хранилище
Отказоустойчивая кластеризация 101 Узлы отслеживают состояние работоспособности других узлов При возникновении сбоя на узле проверка работоспособности завершается с ошибкой и запускается обработка отказа Другой узел ищет в своей копии базы данных кластера данные о содержимом сбойного узла Приложение перезапускается на другом узле Приложение считывает сохраненные данные из общего хранилища В ходе обработки отказа клиенты могут почувствовать незначительную задержку
Публичная сеть Общее хранилище Отработка отказа
Сеть SAN Кластер iSCSI Кластер Сравнение кластеризации узла и гостевого ресурса Кластеризация узла Служба кластеров запускается внутри (физически) узла и управляет виртуальными машинами Виртуальные машины перемещаются между узлами кластера Кластеризация гостевого ресурса Служба кластеров запускается внутри виртуальной машины Для управления приложениями и службами внутри виртуальной машины используется кластер Приложения перемещаются между кластеризованными виртуальными машинами
Какие задачи решает кластеризация ? При наличии критически важных систем никогда не полагайтесь на один сервер – Исключение единственных точек отказа Обработка сбойных узлов – Виртуальные машины перезапускаются на другом узле Перезапуск сбойных виртуальных машин – Операционная система виртуальной машины перезапускается на этом же узле Восстановление зависших виртуальных машин – Операционная система виртуальной машины перезапускается на том же узле Поддержание нулевого времени простоя и установка пакетов на узлах – Динамическая миграция виртуальных машин на другие узлы Мобильность и распределение нагрузки – Динамическая миграция виртуальных машин на другие серверы для балансировки нагрузки
CLUSTER iSCSI Какие задачи решает кластеризация гостевых ресурсов? Мониторинг работоспособности приложения – Приложения или службы, расположенные на сбойной или зависшей виртуальной машине, перемещаются на другую виртуальную машину Мобильность приложения – Для обслуживания или установки пакетов исправлений гостевой ОС приложения или службы перемещаются на другую виртуальную машину
ESX 3.5 или более ранней версии vSphere 4.0vSphere 4.1 Windows NT Server 4.0 Нет Windows 2000 Server Нет Windows Server 2003 НетДа (ограниченное число конфигураций оборудования) Нет Windows Server 2008 НетДа (см. ограничения VMware) Windows Server 2008 R2 НетДа (см. ограничения VMware) Кластеризация гостевых ресурсов в VMware Политика поддержки VMware Кластеризация гостевых ресурсов на VMware (требуется выполнение дополнительных условий) См. руководство VMware /r41/vsp_41_mscs.pdf Политика поддержки Майкрософт Решение должно иметь эмблему или пройти тестирование Дополнительные сведения см. в блоге /07/ aspx
Модуль 4. Высокая доступность и кластеризация Требования к оборудованию и программному обеспечению
Fibre Channel Fibre Channel iSCSI SAS Система хранения данных кластера Команды SCSI-3 – Требуется поддержка постоянного резервирования Поддержка GPT и MBR-дисков Рекомендуется использовать Multipath I/O (MPIO) Аналогичные требования для общих томов кластера (CSV) – Требуется использовать файловую систему NTFS
Сеть Интеграция со стеком TCP/IP Windows Server Несколько сетей для обеспечения избыточности – Общедоступная сеть – Внутренняя сеть кластеров – Динамическая миграция и управление Hyper-V IPv4, IPV6 и туннелирование IPv6 Использование динамических или статических IP-адресов
Требования к программному обеспечению Отказоустойчивая кластеризация предоставляется по умолчанию – Windows Server R2 Datacenter – Windows Server R2 Enterprise – Windows Server R2 Enterprise для IA-64 – Microsoft Hyper-V Server 2008 R2 – Windows Storage Server 2008 R2 Архитектура – x64: до 16 узлов – IA-64: до 8 узлов
Загрузите БЕСПЛАТНУЮ ОС узла Создан на основе Server Core для обеспечения более высокой доступности Поддерживает отказоустойчивую кластеризацию, Hyper-V, CSV и динамическую миграцию Для управления используется синтаксис командной строки, PowerShell или графический интерфейс пользователя (RSAT) Поддерживает до 16 узлов Дополнительные сведения:
Модуль 4. Высокая доступность и кластеризация Развертывание кластера
Поддержка кластеров ПРОСТОТА можно использовать любое оборудование Можно использовать имеющееся оборудование 2 требования для получения поддержки: – Все компоненты должны иметь эмблему – Решение должно пройти тестирование
Проверка конфигурации кластера Запуск до, в ходе и после развертывания – Дополнительные тесты для проверки соответствия рекомендациям запускаются после развертывания приложений и служб высокой доступности Наборы тестов для каждого компонента решения – Конфигурация – Оборудование – Сеть – Хранилище – Система Все отчеты сохраняются автоматически Дополнительные сведения:
Командная строка (Cluster.exe)WMI Диспетчер отказоустойчивости кластеров PowerShell PowerShell RSAT RSAT SCOMSCVMM Использование интегрированных средств Множество параметров управления
Модуль 4. Высокая доступность и кластеризация Высокая доступность Hyper-V
Поддержка PowerShell Улучшенная управляемость – Запуск проверок – Простота создания кластеров и ролей HA – Создание отчетов о зависимостях – Встроенная справка (get-help cluster) Интеграция Hyper-V – Создание виртуальных машин: Add-ClusterVirtualMachineRole – Быстрая миграция: Move-ClusterGroup – Динамическая миграция: Move-ClusterVirtualMachineRole – Добавление диска в CSV: Add-ClusterSharedVolume – Перемещение CSV-диска: Move-ClusterSharedVolume – Обновление конфигурации виртуальной машины: Update-ClusterVirtualMachineConfiguration Server Core, Hyper-V Server 2008 R2 и средства удаленного администрирования сервера (RSAT)
Кластеризация любых ресурсов Поддерживаемые роли и компоненты Общие – Hyper-V – SQL – Exchange – Файловый сервер Новое в 2008 R2 – Репликация DFS – Удаленный рабочий стол CB Сторонние производители – Множество различных ролей Другие роли и компоненты, поставляемые с решением – Пространство имен DFS – DHCP – DTC – iSNS – Очередь сообщений (MSMQ) – NFS – Печать – WINS Общие контейнеры – Универсальное приложение – Универсальный сценарий – Универсальная служба – Прочие серверы
Hyper-V с отказоустойчивой кластеризацией В Windows Server 2008 R2 добавлено множество компонентов Интегрированное развертывание и управление посредством единого графического интерфейса пользователя Создание и кластеризация виртуальных машин с помощью одного мастера
Плотность виртуальных машин виртуальных машин на один кластер Не более 384 виртуальных машин на один узел Развертывание виртуальных машин на любом количестве узлов – 8 кластеров с 4 узлами = виртуальных машин с помощью 32 серверов Необходимо учесть при планировании – Ограничения Hyper-V – Ограничения оборудования – Память – Процессоры – Резервная емкость – Скорость ввода-вывода хранилища и величина задержки
CLUSTER SAN Мониторинг работоспособности виртуальных машин Параметр пульса виртуальной машины – Требуется установка компонентов интеграции (IC) Проверка работоспособности ОС виртуальной машины с узла – Ошибки пользователей – Сбои системы
Автоматический запуск виртуальных машин Позволяет назначать приоритеты виртуальных машин Позволяет запускать наиболее важные виртуальные машины в первую очередь Группирование включено по умолчанию Для восстановления после сбоя потребуется перезапустить вручную отключенные виртуальные машины
Улучшенное распределение виртуальных машин после холодного запуска Служба или приложение HA возвращаются первоначальному владельцу Включен по умолчанию для групп виртуальных машин Для остальных групп отключен по умолчанию Использование режима Persistent
Позволяет распространять виртуальные машины на другие узлы Обеспечивает более эффективное использование ресурсов операционной системы узла Распределение виртуальных машин в кластере гостевой ОС Распределение виртуализированных контроллеров домена Хранение установок на разных узлах Требуется настройка свойства группирования
Передача данных в любой сети VHD Узел координатора 1 LUN : множество виртуальных машин Любой узел может получить доступ к хранилищу Общие тома кластера VHD – виртуальный жесткий диск
Число виртуальных машин на один диск общего тома кластера Отсутствует ограничение числа виртуальных машин на томе CSV Производительность зависит от массива хранилища – Сколько виртуализированных серверов могут получить доступ к 1 LUN? – Обратитесь к производителю хранилища Сколько операций ввода-вывода в секунду может выполнять ваш массив хранилища?
Передача данных в любой сети VHD Узел координатора 1 LUN : множество виртуальных машин Любой узел может получить доступ к хранилищу Общие тома кластера
VMware VMFS3 Microsoft CSV Максимальный размер тома2 ТБ256 ТБ Минимальный размер тома1,2 ГБ1 МБ Максимальное число разделов 128 Поддержка MultiPath Ограниченная поддержка (отсутствует балансировка нагрузки для iSCSI); MPIO сторонних производителей - только EE+ Расширяемая, широкая поддержка массива хранилища Структура каталогов Ограничена (1 виртуальная машина на одну папку) Не ограничена Максимальное число файлов на один том ~ Свыше 4 млрд. Максимальное число виртуальных машин на один том 256Не ограничено Рекомендуемое максимальное число виртуальных машин на один том 32 (связано с масштабируемостью ввода- вывода) Не ограничено Сравнение VMFS и CSV
Содержимое памяти копируется на новый сервер Динамическая миграция Возможно добавочное копирование данных до тех пор, пока данные на обоих узлах не станут идентичными VHD Динамическая миграция Полностью скопированная память виртуальной машины
VHD ARP перенаправляет клиентов на новый узел После успешного завершения старая виртуальная машина удаляется Клиент, перенаправленный на новый узел Динамическая миграция Поддерживается состояние сеанса Подключения не требуются Клиент остается подключенным к «живой» виртуальной машине
Модуль 4. Высокая доступность и кластеризация Аварийное восстановление
Общие сведения об аварийном восстановлении Узлы находятся в разных физических расположениях Аварии неизбежны, поэтому будьте всегда готовы! Если ваша организация уже инвестировала средства в кластеризацию, предпримите дополнительные действия для поддержания работоспособности облака Существует множество решений, среди которых можно выбрать то, которое отвечает потребностям бизнеса
Site B Узел расположен на сайте, который отделен физически Сайт AСайт B Определение аварийного восстановления Аварийное восстановление (DR) позволяет приложениям или виртуальным машинам обеспечивать доступность служб путем перемещения служб в узел кластера, находящийся в другом физическом расположении
Отказоустойчивая кластеризация предоставляет полностью автоматизированное и легкотестируемое решение аварийного восстановления Преимущества использования кластера с несколькими сайтами Защита от потерь во всем расположении – Отключение электричества, пожары, ураганы, наводнения, землетрясения, терроризм и т. д. Автоматизация обработки отказа – Сокращение времени простоя – Снижение уровня сложности плана аварийного восстановления
Сайт A Общедоступная сеть Резервная сеть Сайт B Замечания по сети Для отказоустойчивой кластеризации расстояние не имеет значения – Большие расстояния означают большую задержку в сети В целях безопасности канал обмена данными между узлами можно шифровать Параметры развертывания сети 1. Растяжение виртуальной локальной сети между сайтами 2. Узлы кластера могут находиться в разных подсетях
DNS-сервер 1 DNS-сервер 2 Репликация DNS Запись создана IP-адрес виртуальной машины Запись обновлена IP-адрес виртуальной машины Сайт A Сайт B Запись обновлена Запись получена Сведения о DNS Узлы расположены в разнородных подсетях Виртуальная машина получает новый IP-адрес Для повторного подключения клиентам требуется новый IP-адрес виртуальной машины (от службы DNS) Параметры RegisterAllProvidersIP и HostRecordTTL
DNS-сервер 1 IP-адрес виртуальной машины Сайт AСайт B Решение 1. Локальная отработка отказа Для обеспечения высокой доступности настройте локальную отработку отказа – IP-адреса не изменяются – Отсутствуют проблемы репликации DNS – Данные не передаются по глобальной сети Отработка отказа между сайтами для аварийного восстановления
DNS-сервер 1 DNS-сервер 2 FS = Сайт AСайт B VLAN Решение 2. Растягивание VLAN Развертывание VLAN позволяет сократить время повторного подключения клиента – IP-адрес виртуальной машины никогда не изменяется
DNS-сервер 1 DNS-сервер 2 IP-адрес виртуальной машины Сайт AСайт B Решение 3. Абстракция сетевого устройства Сетевое устройство использует независимый сторонний IP-адрес Сторонний IP-адрес зарегистрирован в DNS и используется клиентом
Сайт A Сайт B VLAN Сеть CSV Общие тома кластера требуют, чтобы узлы находились в одной подсети – В сети CSV используйте виртуальную локальную сеть – Остальные сети могут поддерживать несколько подсетей
Обновление IP-адреса виртуальной машины при отработке отказа Не требуется при нахождении в одной подсети При отработке отказа между подсетями, если гостевая ОС – Использует DHCP, то IP-адрес обновляется автоматически – Использует статический IP-адрес, IP-адрес необходимо настроить после отработки отказа (можно использовать сценарии) При наличии нескольких подсетей для гостевой ОС рекомендуется использовать DHCP
Динамическая миграция между сайтами Динамическая миграция запущенных виртуальных машин между сайтами – Повторные подключения TCP делают перемещение незаметным для клиентов Для динамической миграции между сайтами используйте VLAN – IP-адрес виртуальной машины не изменяется Планирование пропускной способности сети – Динамическая миграция может потребовать существенную пропускную способность в зависимости от объема памяти, выделенного для виртуальной машины – При большой величине задержки или низкой пропускной способности подключения глобальной сети динамическая миграция может занять много времени CSV и динамическая миграция это отдельные, но взаимодополняющие друг друга технологии
Site B Сайт AСайт B Использование хранилища в кластерах с несколькими сайтами Отличается от локальных кластеров Несколько независимых общих массивов хранилища на каждом сайте Узлы обращаются к локальному хранилищу, расположенному в их сайтах Отсутствует общий диск, доступный для всех узлов
Site A Изменения на сайте A реплицируются на сайт B Site B Сайт AСайт B РепликаРеплика Для аварийного восстановления требуется механизм репликации данных между сайтами Хранилище
Основное хранилище Дополнительное хранилище Запись завершена Репликация Подтверждение Запрос на запись Синхронная репликация Узел получает от хранилища ответ «запись завершена» после успешной записи данных на обоих устройствах хранилища
Основное хранилище Дополнитель ное хранилище Запись завершена Запрос на запись Репликация Асинхронная репликация Узел получает от хранилища ответ «запись завершена» после успешной записи данных только на основном устройстве хранения, затем выполняется репликация
Решения для репликации Аппаратная репликация – Репликация на уровне блоков Программная репликация – Репликация на уровне файлов Специальное оборудование для репликации – Репликация на уровне файлов
ГолосГолос ГолосГолосГолосГолос ГолосГолосГолосГолос Общие сведения о кворуме Кворум обеспечивает единоличное владение ресурсами Большинство означает более 50 % Возможные участники кворума – Узлы (1 от каждого) + свидетель (диск или файловый ресурс-свидетель ) 4 типа кворума: – Только диск (не рекомендуется) – Большинство узлов и диск – Большинство узлов – Большинство узлов и файловый ресурс-свидетель
Репллицированное хранилище ? ГолосГолос ГолосГолос ГолосГолос Реплицированный диск-свидетель Диск-свидетель это решающий голос при разрыве сетевого подключения – диск-свидетель должен принимать решения единолично, в противном случае возможны проблемы Не используйте диск-свидетель в кластерах с несколькими сайтами, если иное не указано производителем
Сайт B Сайт A Сетевое подключение между сайтами может быть разорвано! Могу ли я обмениваться данными с большинством узлов в кластере? Да Могу ли обмениваться данными с большинством узлов в кластере? Нет, отсутствует членство в кластере Кластер с 5 узлами: Большинство = 3 Большинство в основном сайте Кворум: большинство узлов
Восстановление на сайте 1 Могу ли обмениваться данными с большинством узлов в кластере ? Нет, отсутствует членство в кластере Могу ли обмениваться данными с большинством узлов в кластере ? Нет, отсутствует членство в кластере Кластер с 5 узлами: Большинство = 3 Включение кворума вручную Site A Сбой Сайт B Большинство в основном сайте Кворум: большинство узлов
Сайт AСайт B Сайт C (филиал) Устойчивость и автоматическое восстановление при разрыве подключения 1 сайта \\Foo\Share WAN Файловый ресурс- свидетель Конфигурация: несколько сайтов с файловым ресурсом-свидетелем
Файловый ресурс- свидетель \\Foo\Share WAN Устойчивость и автоматическое восстановление при разрыве соединения между сайтами Могу ли я обмениваться данными с большинством голосующих ? Нет (блокировка отсутствует), отсутствует членство в кластере Могу ли я обмениваться данными с большинством голосующих ? Нет (блокировка отсутствует), отсутствует членство в кластере Сайт BСайт A М огу ли я обмениваться данными с большинством (блокировка на FSW) голосующих в кластере? Да М огу ли я обмениваться данными с большинством (блокировка на FSW) голосующих в кластере? Да Сайт C (филиал) Конфигурация: несколько сайтов с файловым ресурсом-свидетелем
Файловый ресурс-свидетель (FSW) Простой файловый сервер Windows Один файловый сервер может быть файловым ресурсом-свидетелем для нескольких кластеров – Каждому кластеру требуется собственный ресурс- свидетель – Возможно обеспечение высокой доступности на отдельном кластере Для аварийного восстановления рекомендуется располагать на отдельном сайте Файловый ресурс-свидетель не должен располагаться в том же кластере Файловый ресурс-свидетель не должен располагаться на виртуальной машине, запущенной в том же кластере
Руководства по кластеризации в среде с несколькими сайтами Руководство по проектированию: Руководство по развертыванию/контрольный список:
932&EventCategory=3&culture=en-US&CountryCode=US Виртуальная лаборатория TechNet. Отказоустойчивая кластеризация Windows Server 2008 Enterprise
Ресурсы по высокой доступности Блог группы разработчиков отказоустойчивой кластеризации и балансировки нагрузки Отказоустойчивая кластеризация clustering-main.aspxhttp:// clustering-main.aspx Обеспечение высокой доступности Hyper-V us/magazine/ higha.aspxhttp://technet.microsoft.com/en- us/magazine/ higha.aspx
Учебный портал по виртуализации – – Сведения о книгах, выпущенных издательством MS Press, сведения об обучении в режиме онлайн, обучении с инструктором и официальных курсах корпорации Майкрософт Сертифицированный технический специалист Microsoft (MCTS) виртуализация – : TS : Windows Server 2008 R2, виртуализация рабочих столов И – : TS : Windows Server 2008 R2, виртуализация серверов ИЛИ – : TS : Виртуализация Windows Server, настройка Сертифицированный ИТ-специалист Microsoft (MCITP) виртуализация – : PRO : Windows Server 2008 R2, администратор виртуализации Обучение в аудитории по программе сертификации – 6422A: Implementing and Managing Windows Server 2008 Hyper-V (экзамен ) – 10215A: Implementing and Managing Microsoft Server Virtualization (экзамен ) – 10324A: Implementing and Managing Microsoft Desktop Virtualization (экзамен ) – 50273A: Planning and Designing Microsoft Virtualization Solutions (экзамен ) – Чтобы найти учебный класс, посетите веб-страницу Ресурсы по виртуализации Майкрософт
Заключение Отказоустойчивая кластеризация оптимизирована для Hyper-V Встроенная установка, проверка, настройка и управление Гибкие требования к оборудованию Множество параметров управления Поддержка до 100 виртуальных машин Автоматическое аварийное восстановление
© Корпорация Майкрософт (Microsoft Corporation), Все права защищены. Microsoft, Windows, Windows Vista, Windows Azure, Hyper-V являются охраняемыми товарными знаками корпорации Майкрософт в США и других странах. Настоящий документ предоставляется исключительно в ознакомительных целях и отражает текущую позицию корпорации Майкрософт на дату публикации. Поскольку корпорация Майкрософт должна реагировать на изменение рыночных условий, настоящий документ не должен интерпретироваться как обязательство корпорации Майкрософт. Корпорация Майкрософт не может гарантировать точность сведений, предоставленных после даты публикации. КОРПОРАЦИЯ МАЙКРОСОФТ ОТКАЗЫВАЕТСЯ ОТ ЛЮБЫХ ГАРАНТИЙНЫХ ОБЯЗАТЕЛЬСТВ В ОТНОШЕНИИ СВЕДЕНИЙ НАСТОЯЩЕГО ДОКУМЕНТА, ВКЛЮЧАЯ ЯВНЫЕ, ПОДРАЗУМЕВАЕМЫЕ ИЛИ ПРЕДУСМОТРЕННЫЕ ЗАКОНОМ.