Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этом разделе описаны задачи и средства, которые можно использовать для устранения ошибок, которые могут возникнуть во время операций управляемого резервного копирования SQL Server в Microsoft Azure.
Обзор
Управляемое резервное копирование SQL Server для Microsoft Azure имеет встроенные проверки и средства для устранения неполадок, поэтому во многих случаях внутренние сбои устраняются самим процессом.
Примером одного из таких случаев является удаление файла резервной копии, что приводит к разрыву цепочки журналов, влияющей на возможность восстановления. Управляемое резервное копирование SQL Server в Microsoft Azure определит разрыв в цепочке журналов и запланирует немедленное создание резервного копирования. Однако рекомендуется отслеживать состояние и устранять все ошибки, требующие вмешательства вручную.
Управляемое резервное копирование SQL Server в Microsoft Azure регистрирует события и ошибки с помощью системных хранимых процедур, системных представлений и расширенных событий. Системные представления и хранимые процедуры предоставляют сведения о конфигурации управляемого резервного копирования SQL Server в Microsoft Azure, состояние запланированных резервных копий, а также ошибки, захваченные расширенными событиями. Управляемое резервное копирование SQL Server в Microsoft Azure использует расширенные события для записи ошибок, используемых для устранения неполадок. Помимо записи событий, политики интеллектуального администрирования SQL Server предоставляют состояние работоспособности, которое используется задачей уведомления по электронной почте для отправки сообщений об ошибках и проблемах. Дополнительные сведения см. в статье "Мониторинг управляемого резервного копирования SQL Server в Azure".
Управляемое резервное копирование SQL Server в Microsoft Azure также использует то же ведение журнала, которое используется при резервном копировании вручную в хранилище Azure (резервное копирование SQL Server по URL-адресу). Дополнительные сведения о проблемах, связанных с резервным копированием по URL, см. в разделе Лучшие практики и устранение неполадок по резервному копированию SQL Server по URL-адресу.
Основные шаги диагностики
Включите уведомления по электронной почте, чтобы начать получать уведомления об ошибках и предупреждениях.
Кроме того, можно периодически запускать
smart_admin.fn_get_health_status, чтобы проверять агрегированные ошибки и их количество. Например,number_of_invalid_credential_errors— это количество раз, когда интеллектуальное резервное копирование пыталось выполнить резервную копию, но возникла ошибка недопустимых учетных данных.Number_of_backup_loopsиnumber_of_retention_loopsне являются ошибками; но указывают количество раз, когда поток резервного копирования и поток хранения сканируют список баз данных. Обычно, когда @begin_time и @end_time не предоставляются, функция отображает сведения за последние 30 минут, и в этом случае мы обычно должны видеть ненулевые значения для этих двух столбцов. Если они равны нулю, это означает, что система перегружена или даже система не отвечает. Дополнительные сведения см. в разделе "Устранение неполадок системы " далее в этом разделе.Просмотрите журналы расширенных событий, чтобы узнать больше об ошибках и других связанных событиях.
Используйте сведения в журналах для устранения проблемы. В случае проблемы системы или ошибки может потребоваться перезапустить службу или агент SQL Server.
Распространенные причины ошибок
Ниже приведен список распространенных причин, приводящих к сбоям:
Изменения учетных данных SQL: Если имя учетных данных, используемых управляемой резервной копией SQL Server в Microsoft Azure, изменено или если оно удалено, управляемое резервное копирование SQL Server в Microsoft Azure не сможет выполнять резервные копии. Изменение должно применяться к управляемому резервному копированию SQL Server к параметрам конфигурации Microsoft Azure.
Изменения значений ключей доступа к хранилищу: Если значения ключа хранилища изменяются для учетной записи Azure, но учетные данные SQL не обновляются с новыми значениями, при аутентификации в хранилище SQL Server Managed Backup в Microsoft Azure произойдет сбой, и не удастся создать резервные копии баз данных, настроенных для использования этой учетной записи.
Изменения учетной записи хранения Azure: Удаление или переименование учетной записи хранения без соответствующих изменений учетных данных SQL приведет к сбою управляемого резервного копирования SQL Server в Microsoft Azure, и резервное копирование не будет выполнено. При удалении аккаунта хранения убедитесь, что базы данных перенастроены с актуальными сведениями об аккаунте хранения. Если учетная запись хранения переименована или значения ключей изменены, убедитесь, что эти изменения отражаются в учетных данных SQL, используемых управляемой резервной копией SQL Server в Microsoft Azure.
Изменения свойств базы данных: Изменения моделей восстановления или изменение имени могут привести к сбою резервных копий.
Изменения в модели восстановления: Если модель восстановления базы данных изменена с полной или частичной журнализации на простую, резервные копии прекратятся, и базы данных будут пропущены управляемым резервным копированием SQL Server в Microsoft Azure. Дополнительные сведения см. в статье SQL Server Managed Backup to Azure: взаимодействие и сосуществование
Наиболее распространенные сообщения об ошибках и решения
Ошибки при включении или настройке управляемого резервного копирования SQL Server в Microsoft Azure:
Ошибка: "Не удалось получить доступ к URL-адресу хранилища.... Укажите допустимые учетные данные SQL..." — это и другие аналогичные ошибки, ссылающиеся на учетные данные SQL. В таких случаях просмотрите имя предоставленных учетных данных SQL, а также сведения, хранящиеся в учетных данных SQL— имя учетной записи хранения, а также ключ доступа к хранилищу и убедитесь, что они являются текущими и допустимыми.
Ошибка: "... не удается настроить базу данных.... поскольку это системная база данных": при попытке включить управляемое резервное копирование SQL Server в Microsoft Azure для системной базы данных появится эта ошибка. Управляемое резервное копирование SQL Server в Microsoft Azure не поддерживает резервные копии системных баз данных. Чтобы настроить резервное копирование для системной базы данных, используйте другие технологии резервного копирования SQL Server, такие как планы обслуживания.
Ошибка:" ... Укажите период хранения...." При первом настройке этих значений могут возникать ошибки в отношении периода хранения, если вы либо не указали период хранения для базы данных или экземпляра. При указании значения, отличного от числа от 1 до 30, может возникнуть ошибка. Допустимое значение периода хранения — это число от 1 до 30.
Ошибки уведомления по электронной почте:
Ошибка: "Компонент Database Mail не включен..." — эта ошибка отображается при включении уведомлений электронной почты, но компонент Database Mail не настроен на экземпляре. Чтобы получить уведомление о состоянии работоспособности управляемого резервного копирования SQL Server в Microsoft Azure, необходимо настроить компонент Database Mail на экземпляре. Сведения о том, как включить почту базы данных, см. в разделе "Настройка компонента Database Mail". Агент SQL Server также должен включить использование компонента Database Mail для уведомлений. Дополнительные сведения см. в разделе "Перед началом работы".
Ниже приведен список номеров ошибок, которые могут быть связаны с уведомлениями по электронной почте:
ErrorNumber: 45209
ErrorNumber: 45210
ErrorNumber: 45211
Ошибки подключения:
Ошибки, связанные с подключением к SQL: Эти ошибки возникают при возникновении проблем, связанных с подключением к экземпляру SQL Server. Расширенные события выявляют этот тип ошибок через административный канал. Ниже приведены два расширенных события, которые могут отображаться при возникновении ошибок, связанных с этим типом проблем с подключением:
FileRetentionAdminXEvent с event_type = SqlError. Дополнительные сведения об этой ошибке см. в error_code, error_message и stack_trace этого события. Error_code — это номер ошибки SqlException.
SmartBackupAdminXevent со следующими сообщениями/префиксами сообщений:
"При настройке управляемого резервного копирования SQL Server в параметры Azure по умолчанию произошла внутренняя ошибка. Ошибка может быть временной".
"Вероятно, возникают проблемы с подключением к SQL Server. Пропуск базы данных в текущей итерации".
Ошибка при запросе информации об использовании журнала. Сбой может быть временным. Пропуск базы данных в текущей итерации".
"При загрузке метаданных агента SSMBackup2WA возникло исключение SQL. Сбой может быть временным. Операция будет повторно выполнена.
"SSMBackup2WA обнаружил исключение SQL во время ... "
Ошибки, связанные с подключением к учетной записи хранения:
Исключения хранения отображаются в FileRetentionAdminXEvent с event_type = XstoreError. Дополнительные сведения об ошибке см. в сообщении об ошибке (error_message) и трассировке стека (stack_trace) этого события.
Так как управляемое резервное копирование SQL Server использует базовую технологию резервного копирования для URL-адреса, ошибки, связанные с подключением к хранилищу, применяются к обеим функциям. Для получения дополнительной информации об устранении неполадок см. раздел «Устранение неполадок» в статье «Резервное копирование SQL Server по URL-адресу: Лучшие практики и устранение неполадок» .
Устранение неполадок системы
Ниже приведены некоторые сценарии, когда возникает проблема с системой (SQL Server, агент SQL Server) и ее влияние на управляемое резервное копирование SQL Server в Microsoft Azure:
Sqlservr.exe перестает отвечать на запросы или перестает работать при выполнении управляемого резервного копирования SQL Server в Microsoft Azure: Если SQL Server перестает работать, агент SQL корректно завершит работу, управляемое резервное копирование SQL Server в Microsoft Azure также останавливается, а события регистрируются в файле SQL Agent.out.
Если SQL Server перестает отвечать, события регистрируются в канале администрирования. Пример журнала событий:
Ошибка SQL (подсистема не отвечает или получает sqlException: SqlException:
Код ошибки, сообщение и стек трассировки будут отображаться в Xevent административного канала вместе с некоторыми дополнительными сведениями, такими как:
"Вероятно, возникают проблемы с подключением к SQL Server. Пропуск базы данных в текущей итерации"Агент SQL перестает отвечать на запросы или перестает работать при запуске управляемого резервного копирования SQL Server в Microsoft Azure:
Если агент SQL перестает работать, управляемое резервное копирование SQL Server в Microsoft Azure также останавливается, а события регистрируются в канале администрирования. Это аналогично сценариям, когда SQL Server перестает отвечать.
Если агент SQL перестает отвечать, управляемое резервное копирование SQL Server в Microsoft Azure не сможет продолжать операции резервного копирования, а события регистрируются в канале администрирования. Пример журнала событий:
Задания зависли: см. xevents в административном канале
"Обновление хода выполнения не было получено от SQL Server больше " + Constants.DBBackupInfoMsgMaxWaitTime + " часов резервного копирования базы данных. SSM Cloud Backup будет продолжать ждать".
Если вы включили уведомление по электронной почте, вы получите уведомление, включающее количество циклов резервного копирования и количество циклов хранения. Если значение, возвращаемое в уведомлении для одного или обоих из этих двух столбцов, равно нулю, это может быть признаком того, что система не отвечает.
Предупреждение
Внутренние процессы, создающие результаты отчета, предполагают, что журналы диагностики ядра находятся в том же расположении журнала ошибок агента SQL, который по умолчанию находится в той же папке, что и журналы ошибок экземпляра SQL Server. Если журналы диагностики подсистемы перемещаются в расположение, отличное от расположения журнала ошибок агента SQL, система не может найти журналы диагностики интеллектуального резервного копирования, поэтому отчет в уведомлении электронной почты может не быть правильным. Например, можно увидеть значение 0 во всех полях, включая число циклов резервного копирования и количество циклов хранения. В этом случае, когда журналы диагностики перемещаются в другое расположение, это может не означать, что система не отвечает, но система не может найти журналы. Убедитесь, что журналы диагностики и журналы ошибок агента SQL сначала совпадают по расположению. Чтобы проверить текущее расположение журналов диагностики, можно использовать sys.dm_os_server_diagnostics_log_configurations. Столбец path возвращает текущее расположение журналов диагностики подсистемы. Он должен находиться в той же папке, что и журналы ошибок агента SQL. Путь журнала ошибок агента SQL можно получить с помощью хранимой dbo.sp_get_sqlagent_properties процедуры.
Проверьте журналы расширенных событий, чтобы просмотреть сведения об ошибках. исправьте ошибки или перезапустите агент SQL Server, чтобы исправить ситуацию.