Поделиться через


Экземпляры отказоустойчивого кластера Always On (SQL Server)

В рамках предложения SQL Server Always On, экземпляры отказоустойчивого кластера Always On используют функции отказоустойчивости кластеров Windows Server (WSFC) для обеспечения локальной высокой доступности посредством избыточности на уровне экземпляра кластера (FCI). FCI — это один экземпляр SQL Server, установленный в узлах отказоустойчивой кластеризации Windows Server (WSFC) и, возможно, в нескольких подсетях. FCI в сети представляется как экземпляр SQL Server, работающий на одном компьютере, но обеспечивает переключение на резервный узел с одного узла WSFC на другой, если текущий узел становится недоступным.

FCI может использовать группы доступности AlwaysOnдля обеспечения удаленного аварийного восстановления на уровне базы данных. Дополнительные сведения см. в разделе "Отказоустойчивая кластеризация" и "Группы доступности AlwaysOn" (; SQL Server);.

Замечание

Начиная с SQL Server 2014, экземпляры отказоустойчивых кластеров AlwaysOn поддерживают общие тома кластеров (CSV) как в Windows Server 2008 R2, так и в Windows Server 2012. Дополнительные сведения о CSV см. в разделе Понимание общих томов кластеров в отказоустойчивом кластере.

В этом разделе:

Преимущества экземпляра отказоустойчивого кластера

При отказе оборудования или программного обеспечения сервера приложения или клиенты, подключающиеся к серверу, столкнутся с простоем. Если экземпляр SQL Server настроен как FCI (вместо автономного экземпляра), высокий уровень доступности этого экземпляра SQL Server защищен наличием избыточных узлов в FCI. Только один из узлов в FCI владеет группой ресурсов WSFC одновременно. В случае сбоя (сбоя оборудования, операционной системы, приложения или службы) или при запланированном обновлении владение группой ресурсов передается другому узлу WSFC. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server, и это свести к минимуму время простоя приложения или клиентов во время сбоя. Ниже перечислены некоторые ключевые преимущества, предоставляемые экземплярами отказоустойчивого кластера SQL Server:

  • Защита на уровне экземпляра с помощью избыточности

  • Автоматическое переключение при отказе (аппаратный сбой, сбой операционной системы, сбой приложений или служб)

    Это важно

    В группе доступности Always On автоматическое переключение от FCI на другие узлы в группе доступности не поддерживается. Это означает, что FCI и независимые узлы не должны быть объединены в группе доступности, если автоматическое переключение на отказоустойчивое решение является важным компонентом вашей стратегии высокой доступности. Однако эту интеграцию можно произвести для вашего решения аварийного восстановления.

  • Поддержка широкого спектра решений для хранения, включая диски кластера WSFC (iSCSI, Fibre Channel и т. д.) и общие папки блока сообщений сервера (SMB).

  • Решение для аварийного восстановления с использованием FCI с несколькими подсетями или запуск базы данных, размещенной на узле FCI, в группе доступности Always On. Благодаря новой поддержке нескольких подсетей в MicrosoftSQL Server 2012 многоподсети FCI больше не требует виртуальной локальной сети, повышая управляемость и безопасность FCI с несколькими подсетями.

  • Отсутствие необходимости перенастройки приложений и клиентов при переключении на резервный режим

  • Гибкая политика отработки отказа для событий детализации триггеров для автоматической отработки отказа

  • Надёжное аварийное переключение через периодическую и подробную проверку работоспособности с помощью выделенных постоянных соединений.

  • Настраиваемость и предсказуемость времени переключения на резерв с помощью косвенных фоновых контрольных точек

  • Регулирование использования ресурсов во время режима аварийного переключения

Рекомендации

В рабочей среде рекомендуется использовать статические IP-адреса в сочетании с виртуальным IP-адресом экземпляра отказоустойчивого кластера. Не рекомендуется использовать DHCP в рабочей среде. В случае простоя, если срок аренды IP-адреса DHCP истекает, требуется дополнительное время для повторной регистрации нового IP-адреса DHCP, связанного с DNS-именем.

Общие сведения об экземпляре отказоустойчивого кластера

FCI выполняется в группе ресурсов WSFC, содержащей один или несколько узлов WSFC. При запуске FCI один из узлов берет на себя ответственность за группу ресурсов и переносит его экземпляр SQL Server в режим "в сети". К ресурсам, принадлежащим этому узлу, относятся:

  • Имя сети

  • IP-адрес

  • Общие диски

  • Служба ядра СУБД SQL Server

  • Служба агента SQL Server

  • Служба SQL Server Analysis Services, если она установлена

  • Один ресурс общей папки, если установлен компонент FILESTREAM

В любое время только владелец группы ресурсов (и ни один другой узел в FCI) выполняет соответствующие службы SQL Server в группе ресурсов. Когда происходит переключение на резерв, будь то автоматическое или плановое переключение, имеет место следующая последовательность событий:

  1. Если не происходит сбой оборудования или системы, все грязные страницы в кэше буфера записываются на диск.

  2. Все соответствующие службы SQL Server в группе ресурсов остановлены на активном узле.

  3. Владение группой ресурсов передается другому узлу в FCI.

  4. Новый владелец группы ресурсов запускает службы SQL Server.

  5. Запросы подключения к клиентскому приложению автоматически направляются на новый активный узел с использованием того же имени виртуальной сети (VNN).

FCI находится в сети, пока базовый кластер WSFC находится в хорошем состоянии кворума (большинство узлов WSFC кворума доступны для автоматического переключения в случае отказа). Когда кластер WSFC теряет кворум, независимо от того, вызвано ли это сбоем оборудования, программного обеспечения, сети или неправильной конфигурацией кворума, весь кластер WSFC вместе с FCI отключается. Затем требуется ручное вмешательство в этом незапланированном сценарии отработки отказа, чтобы восстановить большинство голосов в оставшихся доступных узлах и вновь включить кластер WSFC и FCI в сеть. Дополнительные сведения см. в разделе "Режимы кворума WSFC" и "Конфигурация голосования" (; SQL Server);.

Прогнозируемое время переключения

В зависимости от того, когда экземпляр SQL Server последний раз выполнил операцию контрольной точки, в кэше буфера может быть значительное количество грязных страниц. Следовательно, отработка отказа длится до тех пор, пока требуется записать оставшиеся грязные страницы на диск, что может привести к длительному и непредсказуемому времени отработки отказа. Начиная с MicrosoftSQL Server 2012, FCI может использовать косвенные контрольные точки для регулирования количества грязных страниц, хранящихся в кэше буфера. Хотя это потребляет дополнительные ресурсы в рамках обычной рабочей нагрузки, это делает время переключения при отказе более предсказуемым и настраиваемым. Это очень полезно, если соглашение об уровне обслуживания в организации указывает целевое время восстановления (RTO) для решения высокого уровня доступности. Дополнительные сведения о косвенных контрольных точках см. в разделе "Косвенные контрольные точки".

Надежный мониторинг работоспособности и гибкая политика отказоустойчивости

После успешного запуска FCI служба WSFC отслеживает работоспособность базового кластера WSFC, а также работоспособность экземпляра SQL Server. Начиная с MicrosoftSQL Server 2012 служба WSFC использует выделенное подключение для опроса активного экземпляра SQL Server для подробной диагностики компонентов с помощью системной хранимой процедуры. У этого три последствия.

  • Выделенное подключение к экземпляру SQL Server позволяет надежно осуществлять проверку диагностики компонентов на постоянной основе, даже если FCI находится под высокой нагрузкой. Это позволяет различать систему, которая находится под тяжелой нагрузкой, и систему, которая фактически имеет условия сбоя, что позволяет предотвратить такие проблемы, как ложные переключения на резерв.

  • Подробная диагностика компонентов позволяет настроить более гибкую политику резервирования на случай отказа, где можно выбрать, какие условия сбоя запускают резервирование, а какие нет.

  • Подробная диагностика компонентов также обеспечивает более эффективное устранение неполадок автоматических переключений при отказах в ретроспективе. Диагностические сведения хранятся в файлах журналов, которые сопоставляются с журналами ошибок SQL Server. Их можно загрузить в средство просмотра файлов журнала, чтобы проверить состояния компонентов, ведущие к возникновению отказа, и определить его причину.

Дополнительные сведения см. в разделе Политика переключения для экземпляров отказоустойчивого кластера

Элементы экземпляра отказоустойчивого кластера

FCI состоит из набора физических серверов (узлов), содержащих аналогичную конфигурацию оборудования, а также идентичную конфигурацию программного обеспечения, которая включает версию операционной системы и уровень исправлений, а также версию SQL Server, уровень исправлений, компоненты и имя экземпляра. Идентичная конфигурация программного обеспечения необходима для обеспечения полнофункциональной работы FCI при переключении отказа между узлами.

Группа ресурсов WSFC
FCI SQL Server работает в группе ресурсов WSFC. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и контрольные точки ключей реестра, чтобы обеспечить полную функциональность FCI после отказа, и только один из узлов в кластере владеет группой ресурсов в данный момент (активный узел). Служба WSFC управляет кластером серверов, конфигурацией кворума, политикой переключения при отказах и операциями переключения при отказах, а также VNN и виртуальными IP-адресами для FCI. В случае сбоя (аппаратного сбоя, сбоя операционной системы, сбоя приложения или службы) или запланированного обновления владение группой ресурсов переносится на другой узел в FCI. Количество узлов, поддерживаемых в группе ресурсов WSFC, зависит от версии SQL Server. Кроме того, один и тот же кластер WSFC может запускать несколько ЦК (несколько групп ресурсов), в зависимости от емкости оборудования, таких как ЦП, память и количество дисков.

Двоичные файлы SQL Server
Двоичные файлы продукта устанавливаются локально на каждом узле FCI, как и в автономных установках SQL Server. Однако во время запуска службы не запускаются автоматически, но управляются WSFC.

Хранение
В отличие от группы доступности Always On, FCI должен использовать общее хранилище, которое делят все узлы FCI, для хранения базы данных и журналов. Общее хранилище может быть в виде дисков кластера WSFC, дисков в SAN или общих папок на SMB. Таким образом, все узлы в FCI имеют единое представление о данных экземпляра при сбое. Однако это означает, что общее хранилище может быть единственной точкой сбоя, и FCI зависит от базового решения хранилища для обеспечения защиты данных.

Сетевое имя
VNN для FCI обеспечивает единую точку подключения для FCI. Это позволяет приложениям подключаться к виртуальной сети без необходимости знать текущий активный узел. При отработки отказа виртуальная сеть регистрируется в новом активном узле после запуска. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server, и это свести к минимуму время простоя приложения или клиентов во время сбоя.

Виртуальные IP-адреса
В случае FCI с несколькими подсетью виртуальный IP-адрес назначается каждой подсети в FCI. Во время переключения при отказе виртуальное сетевое имя (VNN) на DNS-сервере обновляется, чтобы указать виртуальный IP-адрес для соответствующей подсети. Затем приложения и клиенты могут подключаться к FCI, используя то же виртуальное сетевое имя после переключения при отказе на несколько подсетей.

Концепции и задачи переключения при отказе SQL Server

Основные понятия и задачи Тема
Описывает механизм обнаружения ошибок и гибкую политику переключения на резервные ресурсы. Политика отработки отказа для экземпляров отказоустойчивого кластера
Описание концепций администрирования и обслуживания FCI. Администрирование и обслуживание экземпляра отказоустойчивого кластера
Описание конфигурации и концепций нескольких подсетей Кластеризация нескольких подсетей SQL Server (; SQL Server);

Связанные разделы

Описание раздела Тема
Описывает процесс установки нового SQL Server FCI. Создание нового отказоустойчивого кластера SQL Server (; Настройка);
Описывает обновление до отказоустойчивого кластера SQL Server 2014. Обновление отказоустойчивого кластера SQL Server
Описание концепций отказоустойчивой кластеризации Windows и ссылки на задачи, связанные с отказоустойчивой кластеризированием Windows Windows Server 2008: обзор отказоустойчивых кластеров

Windows Server 2008 R2: обзор отказоустойчивых кластеров
Описывает различия в понятиях между узлами в FCI и репликах в группе доступности и рекомендации по использованию FCI для размещения реплики для группы доступности. Отказоустойчивая кластеризация и группы доступности AlwaysOn (SQL Server)