Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Гибкая политика переключения при отказе обеспечивает точный контроль над условиями, которые приводят к автоматическому переключению при отказе для группы доступности. Изменив условия сбоя, которые активируют автоматическое переключение при отказе, и частоту проверок работоспособности, можно увеличить или уменьшить вероятность автоматического переключения при отказе для поддержки SLA по высокои доступности.
Гибкая политика восстановления при отказе группы доступности определяется уровнем условия отказа и порогом времени ожидания проверки работоспособности. При обнаружении превышения группой доступности уровня условия сбоя или порогового времени ожидания проверки работоспособности, библиотека DLL ресурсов группы доступности передает ответ кластеру отказоустойчивой кластеризации Windows Server (WSFC). Затем кластер WSFC инициирует автоматическое переключение на вторичную реплику.
Это важно
Если группа доступности превышает порог сбоя WSFC, кластер WSFC не будет пытаться выполнить автоматическое переключение на резерв для этой группы доступности. Кроме того, группа ресурсов WSFC группы доступности остается в состоянии ошибки до тех пор, пока администратор кластера вручную не приведет группу ресурсов в рабочее состояние или администратор базы данных не выполнит ручное переключение группы доступности. Порог сбоя WSFC определяется как максимальное количество сбоев, поддерживаемых для группы доступности в течение заданного периода времени. Период времени по умолчанию составляет шесть часов, а значение по умолчанию для максимального количества сбоев в течение этого периода — n-1, где n — это число узлов WSFC. Чтобы изменить пороговые значения сбоя для определенной группы доступности, используйте консоль управления отказоустойчивостью WSFC.
Порог тайм-аута Health-Check
Библиотека DLL ресурсов WSFC группы доступности выполняет проверку работоспособности основной реплики путем вызова хранимой процедуры sp_server_diagnostics на экземпляре SQL Server, на котором размещена первичная реплика. sp_server_diagnostics возвращает результаты через интервал, равный 1/3 порога времени ожидания проверки работоспособности для группы доступности. Порог времени ожидания проверки работоспособности по умолчанию составляет 30 секунд, что заставляет sp_server_diagnostics возвращаться через 10 секунд. Если sp_server_diagnostics медленно или не возвращает информацию, библиотека DLL ресурсов будет ждать полного интервала порога времени ожидания проверки состояния перед определением, что первичная реплика не отвечает. Если первичная реплика не отвечает, инициируется автоматическое переключение, если это поддерживается в данный момент.
Это важно
sp_server_diagnostics не выполняет проверку работоспособности на уровне базы данных.
уровень Failure-Condition
Зависимость автоматического переключения на резервный сервер от диагностических данных и сведений о работоспособности, возвращаемых sp_server_diagnostics, определяется уровнем условий сбоя группы доступности. Уровень состояния сбоя указывает, какие условия сбоя активируют автоматическое переключение. Существует пять уровней состояния сбоя, которые варьируются от наименее строгих (уровня один) до наиболее строгих (уровень пять). Данный уровень охватывает менее строгие уровни. Таким образом, самый строгий уровень, пять, включает четыре менее строгие условия и т. д.
Это важно
Поврежденные базы данных и подозрительные базы данных не обнаруживаются на уровне состояния сбоя. Таким образом, база данных, которая повреждена или подозрительная (из-за сбоя оборудования, повреждения данных или другой проблемы), никогда не вызывает автоматическое переключение на резерв.
В следующей таблице описываются условия сбоя, соответствующие каждому уровню.
| Уровень | Условия сбоя | значение Transact-SQL | Значение PowerShell |
|---|---|---|---|
| Один | Сервер не работает. Это наименее строгий уровень. Указывает, что автоматическая отработка отказа инициируется при возникновении любой из следующих ситуаций: Служба SQL Server отключена. Аренда группы доступности для подключения к кластеру WSFC истекла, поскольку от экземпляра сервера не было получено сообщение ACK. Дополнительные сведения см. в статье о том, как это работает: время ожидания аренды AlwaysOn SQL Server. |
1 | OnServerDown |
| Два | Сервер не отвечает. Указывается, что автоматическое переключение инициируется при любой из следующих ситуаций: Экземпляр SQL Server не подключается к кластеру, и превышено пороговое значение времени ожидания проверки работоспособности для группы доступности, указанное пользователем. Реплика доступности находится в неисправном состоянии. |
2 | OnServerUnresponsive |
| Три | При критической ошибке сервера. Указывает, что автоматическое переключение на резервный сервер инициируется при критических внутренних ошибках SQL Server, таких как осиротелые спинлоки, серьезные нарушения доступа к записи или чрезмерная дампа. Это уровень компонента , заданный по умолчанию. | 3 | OnCriticalServerError |
| Четыре | При умеренной ошибке сервера. Указывает, что автоматическое переключение на резервный ресурс инициируется при умеренных внутренних ошибках SQL Server, таких как постоянная нехватка памяти во внутреннем пуле ресурсов SQL Server. | 4 | OnModerateServerError |
| Пять | При любых специфических условиях сбоя. Это самый строгий уровень. Указывает, что автоматический переход на резервный ресурс инициируется в случае любых подходящих условий сбоя, в том числе: Исчерпание рабочих потоков SQL Engine. Обнаружение неразрешимой взаимоблокировки. |
5 | OnAnyQualifiedFailureConditions |
Замечание
Отсутствие ответа экземпляром SQL Server на клиентские запросы не имеет значения для групп доступности.
Связанные задачи
Настроить автоматическое переключение на резерв
Связанные материалы
См. также
Общие сведения о группах доступности AlwaysOn (SQL Server)
Режимы доступности (группы доступности AlwaysOn)
Переключение и режимы переключения (группы доступности AlwaysOn)
Отказоустойчивая кластеризация Windows Server (WSFC) с использованием SQL Server
Политика отработки отказа для экземпляров отказоустойчивого кластера
sp_server_diagnostics (Transact-SQL)