Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье описываются функции, доступные в пользовательском интерфейсе Azure Databricks, для просмотра доступных заданий, просмотра журнала запусков заданий и просмотра сведений о выполнении заданий. Чтобы настроить уведомления для заданий, см. раздел Добавить уведомления в задание.
Чтобы узнать об использовании интерфейса командной строки Databricks для просмотра и выполнения заданий, выполните команды CLI databricks jobs list -h, databricks jobs get -h, и databricks jobs run-now -h. Дополнительные сведения об использовании Jobs API см. в Jobs API.
Если у вас есть доступ к схеме system.lakeflow , вы также можете просматривать и запрашивать записи выполнения заданий и задач из вашей учетной записи. См. справочник по системной таблице заданий. Вы также можете присоединить системные таблицы заданий с таблицами выставления счетов, чтобы отслеживать затраты на задания в вашей учетной записи. См. Отслеживание затрат на задание с помощью системных таблицдля производительности &.
Просмотр заданий и конвейеров
Чтобы просмотреть список заданий, к которых у вас есть доступ, щелкните Задания и конвейеры на боковой панели. Вкладка "Задания и конвейеры" в пользовательском интерфейсе заданий Lakeflow содержит сведения обо всех доступных заданиях и конвейерах, таких как создатель, триггер (если таковые имеются) и результат последних пяти запусков.
Чтобы изменить столбцы, отображаемые в списке, щелкните и выберите или отмените выбор столбцов.
Важный
Список объединенных заданий и конвейеров находится в общедоступной предварительной версии. Вы можете отключить функцию и вернуться к интерфейсу по умолчанию, отключив задания и конвейеры: унифицированное управление, поиск и фильтрацию. Дополнительные сведения см. в статье "Управление предварительными версиями Azure Databricks ".
Вы можете фильтровать задания в списке заданий и конвейеров , как показано на следующем снимке экрана.
-
Поиск текста: поиск ключевых слов поддерживается для полей "Имя " и "Идентификатор задания ". Чтобы найти тег, созданный с ключом и значением, можно выполнить поиск по ключу, по значению или по ключу и значению. Например, для тега с ключом
departmentи значениемfinanceсоответствующие задания можно найти поdepartmentилиfinance. Чтобы выполнить поиск по ключу и значению, введите ключ и значение, разделенные двоеточием (например,department:finance). - Тип: выбирайте только задания, потоки или все.
- Владелец: выберите только задания или конвейеры, которыми вы владеете.
- Избранное: выберите все задания или конвейеры, помеченные как избранное.
- Теги: использование тегов. Для поиска по тегу можно использовать раскрывающееся меню тегов, чтобы отфильтровать до пяти тегов одновременно или напрямую использовать поиск по ключевым словам.
-
Запуск от имени: фильтрация по двум
run asзначениям.
Чтобы запустить задание или конвейер, нажмите кнопку . Чтобы остановить рабочий процесс, нажмите кнопку
. Чтобы получить доступ к другим действиям, щелкните
Например, вы можете удалить рабочий процесс или получить доступ к параметрам конвейера из этого меню.
Просмотр выполняется для одного задания
Вы можете просмотреть список текущих и недавно завершенных запусков для задания, к которому у вас есть доступ, включая те, которые инициированы внешними средствами оркестрации, такими как Apache Airflow или Azure Data Factory. Чтобы просмотреть список недавно выполненных заданий, выполните следующие действия:
На боковой панели рабочей области Azure Databricks щелкните "Задания и конвейеры".
При необходимости выберите фильтры "Задания " и " Принадлежащие мне ".
Щелкните по ссылке с названием вашей работы.
Вкладка "Запуски " отображается с представлениями матрицы и списка активных и завершенных запусков.
В матричном представлении отображается журнал запусков задания, включая каждую задачу задания.
представление матрицы заданий 
В строке общей длительности выполнения матрицы отображается общая длительность выполнения и состояние выполнения. Чтобы просмотреть сведения о выполнении, включая время начала, длительность и состояние, наведите указатель мыши на строку в строке общей продолжительности выполнения.
Каждая ячейка в строке Задачи обозначает задачу и ее соответствующее состояние. Чтобы просмотреть сведения о каждой задаче, включая время начала, продолжительность, кластер и ее состояние, наведите указатель мыши на ячейку с этой задачей.
Панели запусков заданий и задач окрашены в цвета для указания состояния выполнения. Успешные запуски отмечены зеленым. Неудачные запуски красные, пропущенные запуски розовый, и ожидание повторных попыток желтое. Ожидается, отменено или истекло — серым. Высота индикаторов выполнения отдельных задач и операций визуально указывает на продолжительность их выполнения.
Если вы настроили ожидаемое время завершения, представление матрицы отображает предупреждение, когда длительность выполнения превышает настроенное время.
По умолчанию представление списка запусков отображает следующее:
- Время начала запуска.
- Идентификатор выполнения.
- Был ли запуск активирован расписанием заданий, запросом API или вручную.
- Время, затраченное на текущее выполняющееся задание, или общее время выполнения завершенного задания. Предупреждение отображается, если длительность превышает настроенное ожидаемое время завершения.
- Состояние выполнения: В очереди, Ожидание, Выполняется, Пропущено, Успешно, Сбой, Время ожидания истекло, Отмена, или Отменено.
- Код ошибки, с которым завершился запуск.
- Параметры выполнения.
В настоящее время активные запуски отображают кнопку остановки. Чтобы остановить все активные и очередные запуски, выберите Отмена запусков или Отмена всех очередных запусков в раскрывающемся меню.
Используйте для выполнения дополнительных действий в зависимости от контекста, таких как удаление записей о завершенных запусках.
Чтобы получить доступ к действиям, зависящим от контекста для текущего выполнения, щелкните (например, чтобы остановить активное выполнение или удалить завершенное выполнение).
Чтобы изменить столбцы, отображаемые в представлении списка запусков, щелкните
и выберите или отмените выбор столбцов.
Чтобы просмотреть сведения о выполнении задания, щелкните ссылку для запуска в столбце времени запуска в представлении списка запусков. Чтобы просмотреть сведения о последнем успешном выполнении этого задания, нажмите кнопку "Перейти к последнему успешному выполнению".
Azure Databricks хранит историю выполнения ваших заданий до 60 дней. Если необходимо сохранить выполнение заданий, Databricks рекомендует экспортировать результаты до истечения срока их действия. Дополнительные сведения см. в разделе Экспорт результатов выполнения заданий.
Просмотр сведений о выполнении задания
Страница сведений о выполнении задания содержит его выходные данные и ссылки на журналы, включая информацию о завершении или сбое каждой задачи в задании. Сведения о запуске задания можно найти на вкладке Запуски для задания.
Чтобы просмотреть сведения о выполнении задания на вкладке "Запуски ", щелкните ссылку для запуска в столбце "Время начала" в представлении списка запусков. Чтобы вернуться на вкладку «Запуски» для задания, щелкните идентификатор задания.
Задания с несколькими задачами также имеют граф, временную шкалу и представление списка.
Представление графа
Щелкните узел задачи в графе, чтобы просмотреть сведения о выполнении задачи, в том числе:
- Сведения о задаче, включая выполнение от имени пользователя, способ запуска задания, время начала, время окончания, длительность и состояние.
- Исходный код.
- Кластер, выполнивший задачу и содержащий ссылки на историю запросов и журналы.
- Метрики для задачи.
Вид графика заданий 
Вид временной шкалы
Задания, содержащие несколько задач, имеют временную шкалу, чтобы определить задачи, которые занимают много времени для завершения, понять зависимости и наложения, что помогает отладить и оптимизировать эти задания.
Представление списка
По умолчанию в представлении списка отображаются состояние, имя, тип, ресурс, длительность и зависимости. В этом представлении можно добавлять и удалять столбцы.
Вы можете искать задачу по имени, фильтровать по состоянию задачи или типу задачи, а также отсортировать задачи по состоянию, имени или длительности.
Чтобы вернуться на вкладку Выполнения для задания, щелкните значение Идентификатор задания.
Как Azure Databricks определяет состояние выполнения задания?
Azure Databricks определяет, успешно ли выполнено задание на основе результатов конечных задач задания. Листовая задача — это задача, которая не имеет зависимостей дальше по потоку. Выполнение задания может иметь один из трех результатов:
- Выполнено: все задачи были успешными.
- Выполнено с ошибками: некоторые задачи завершились сбоем, но все лицевые задачи были успешными.
- Сбой: не выполнены одна или несколько листовых задач.
- Пропущено: выполнение задания было пропущено (например, задача может быть пропущена, так как превышено максимальное число одновременных запусков для задания или рабочей области).
- Время ожидания: выполнение задания заняло слишком много времени, чтобы завершить работу и истекло время ожидания.
- Отменено: выполнение задания было отменено (например, пользователь вручную отменил текущий запуск).
просмотр метрик потоковых задач
Важный
Наблюдаемость потоковой передачи для заданий Lakeflow доступна в общедоступной предварительной версии.
При просмотре сведений о выполнении задания можно получить данные о рабочих нагрузках потоковой передачи с метриками наблюдаемости потоковой передачи в пользовательском интерфейсе заданий. К этим метрикам относятся секунды задержки, байты задержки, записи задержки и файлы задержки для источников, таких как Apache Kafka, Amazon Kinesis, Auto Loader, Google Pub/Sub и разностные таблицы, которые поддерживаются Spark Structured Streaming. Метрики отображаются в виде диаграмм в правой области при просмотре сведений о выполнении задачи. Метрики, отображаемые на каждой диаграмме, являются максимальными значениями, агрегированными по минутам, и могут включать до предыдущих 48 часов.
Каждый источник потоковой передачи поддерживает только определенные метрики. Метрики, не поддерживаемые источником потоковой передачи, недоступны для просмотра в пользовательском интерфейсе. В следующей таблице показаны метрики, доступные для поддерживаемых источников потоковой передачи:
| источник | невыполненные байты | записи невыполненной работы | секунды невыполненной работы | файлы невыполненной работы |
|---|---|---|---|---|
| Кафка | ✓ | ✓ | ||
| Кинезис | ✓ | ✓ | ||
| Дельта | ✓ | ✓ | ||
| Автозагрузчик | ✓ | ✓ | ||
| Google Pub/Sub | ✓ | ✓ |
Можно также указать пороговые значения для каждой метрики потоковой передачи и настроить уведомления, если поток превышает пороговое значение во время выполнения задачи. См. раздел Настройка уведомлений для медленных заданий.
Чтобы просмотреть метрики потоковой передачи для выполнения задачи, которая передает данные из одного из поддерживаемых источников структурированной потоковой передачи:
- На странице "Детали выполнения задания" щелкните задачу, чтобы просмотреть метрики.
- Перейдите на вкладку
метрик в области выполнения задачи. - Чтобы открыть граф для метрики, щелкните
рядом с именем метрик. - Чтобы просмотреть метрики для определенного потока, введите идентификатор потока в текстовое поле Фильтр по stream_id. Идентификатор потока можно найти в выводе для запуска задания.
- Чтобы изменить период времени для графов метрик, используйте раскрывающееся меню времени.
- Чтобы прокрутить потоки, если выполнение содержит более десяти потоков, нажмите Далее или Назад.
Ограничения наблюдаемости потоковой передачи
- Метрики обновляются каждую минуту, если выполнение не содержит более четырех потоков. Если выполнение содержит более четырех потоков, метрики обновляются каждые пять минут.
- Метрики собираются только для первых пятидесяти потоков в каждом запуске.
- Метрики собираются с интервалом в одну секунду. Метрики могут не отображаться, если значение
triggerIntervalпараметра меньше одной секунды. - Большинство источников данных собирают метрики потоковой передачи по умолчанию. Однако для других пользователей необходимо включить эту функцию. Если ваш источник данных не собирает метрики потоковой передачи, задайте флагу
spark.sql.streaming.metricsEnabledзначениеTrue.
Просмотр журнала выполнения задач
Чтобы просмотреть журнал выполнения задач, включая выполненные и невыполненные запуски, выполните следующие действия:
- Нажмите на задачу на странице Сведения о выполнении задания. Откроется диалоговое окно Сведения о выполнении задач.
- Выберите выполнение задачи в раскрывающемся меню журнала выполнения.
Просмотр журнала выполнения задач для For each задачи
Доступ к истории выполнения задачи For each такой же, как у стандартной задачи Lakeflow Jobs. Вы можете щелкнуть For each узел задачи на странице сведений о выполнении задания или соответствующую ячейку в представлении матрицы. Однако, в отличие от стандартной задачи, детали выполнения For each задачи представлены в виде таблицы итераций вложенной задачи.
Чтобы просмотреть только неудачные итерации, щелкните "Только неудачные итерации".
Чтобы просмотреть выходные данные итерации, щелкните по c0>времени начала или
Просмотр последних выполненных работ по всем заданиям
Важный
Эта функция доступна в общедоступной предварительной версии.
Список запущенных и недавно завершенных запусков для всех заданий в рабочей области, к которой у вас есть доступ, включая запуски, запущенные внешними средствами оркестрации, такими как Apache Airflow или Фабрика данных Azure. Чтобы просмотреть список недавно выполненных заданий, выполните следующие действия:
- Щелкните
Задания и конвейеры на боковой панели.
- Перейдите на вкладку Запуски, чтобы отобразить график количества завершенных запусков и список заданий и запусков конвейера.
- (Необязательно) Щелкните "Задания ", чтобы отфильтровать только задания.
Примечание.
Если у вас отключена предварительная версия единого списка запусков, то вкладка называется запуски задач и отображает список только запусков заданий.
Список запусков включает параметры фильтрации в верхней части, граф недавно завершенных запусков и 5 основных ошибок, и список недавно завершенных запусков.
Фильтровать можно по:
- Имя задания или конвейера.
- Все, задания или конвейеры.
- Тип конвейера (ETL, загрузка, MV/ST или синхронизация таблицы базы данных).
- Запуск от имени пользователя.
- Время запуска (за последние 48 часов).
- Состояние выполнения.
- Код ошибки для неудачных запусков.
Фильтры применяются к графу, кодам ошибок и списку запусков.
Граф количества завершенных запусков
На диаграмме количества завершенных запусков отображается количество выполненных заданий за последние 48 часов. По умолчанию граф отображает неудачные, пропущенные и успешные запуски заданий. Вы также можете отфильтровать граф, чтобы отобразить определенные состояния выполнения или ограничить график определенным диапазоном времени. Вкладка "Запуски" также содержит таблицу запусков заданий за последние 67 дней. По умолчанию таблица содержит сведения о неудачных, пропущенных и успешных запусках заданий.
Примечание.
Граф счетчика завершенных запусков отображается для администраторов для всех запусков. Для пользователей, не являющихся администраторами, нужно нажать «Запустить как» и выбрать меня.
Фильтры в верхней части вкладки "Запуски " применяются к графу.
Чтобы ограничить диапазон времени, отображаемый в графе счетчика завершенных запусков , можно выбрать диапазон времени в приведенном выше фильтре. Кроме того, можно щелкнуть и перетащить курсор в граф, чтобы выбрать диапазон времени. График и таблица запусков обновляются так, чтобы отображать только запуски из выбранного временного диапазона.
В таблице типов ошибок 5 лучших типов ошибок отображается список наиболее частых типов ошибок из выбранного диапазона времени, что позволяет быстро увидеть наиболее распространенные причины проблем с заданием в рабочей области.
Список запусков заданий
Вкладка "Выполнение задания" также содержит таблицу заданий, запущенную за последние 60 дней. По умолчанию таблица содержит сведения о неудачных, пропущенных и успешных запусках заданий.
Фильтры в верхней части вкладки «Запуски» применяются к списку.
По умолчанию в таблице запусков отображается следующее:
- Время начала запуска.
- Имя задания, связанного с запуском.
- Тип (задание или конвейер) выполнения.
- Имя пользователя, от имени которого выполняется задание.
- Как был активирован запуск (запущен) — расписанием задания, запросом API или вручную.
- Время, затраченное на текущее выполняющееся задание, или общее время выполнения завершенного задания. Предупреждение отображается, если длительность превышает настроенное ожидаемое время завершения.
- Состояние выполнения: в очереди, ожидает, выполняется, пропущено, выполнено успешно, неудача, превышено время ожидания, отменяетсяили отменено.
- Любой код ошибки, с которым завершился запуск.
- Все параметры для запуска.
- Чтобы остановить выполнение задания, нажмите кнопку остановки. Чтобы получить доступ к действиям для задания, щелкните
(например, чтобы остановить активный запуск или удалить завершенный запуск).
Чтобы изменить столбцы, отображаемые в списке запусков, щелкните и выберите или отмените выбор столбцов.
Чтобы просмотреть сведения о выполнении задания, щелкните ссылку в столбце Время начала необходимого запуска. Чтобы просмотреть сведения о задании, щелкните его имя в столбце Задание.
Просмотр сведений о происхождении задания
Если каталог Unity включен в рабочей области, вы можете просмотреть информацию о родословной для любых таблиц Unity Catalog в рабочем процессе. Если сведения о происхождении доступны для рабочего процесса, вы увидите ссылку с количеством вышестоящих и подчиненных таблиц в панели сведений о задании для задачи, панели сведений о выполнении задания для выполнения задания или панели сведений о выполнении задачи для выполнения задачи. Щелкните ссылку, чтобы отобразить список таблиц. Щелкните таблицу, чтобы просмотреть подробные сведения в обозревателе каталогов.
Просмотр и запуск задания, созданного с помощью декларативных пакетов автоматизации
Пользовательский интерфейс заданий Lakeflow можно использовать для просмотра и запуска заданий, развернутых декларативными пакетами автоматизации. По умолчанию эти задания доступны только для чтения в пользовательском интерфейсе заданий. Чтобы изменить задание, развернутое пакетом, измените файл конфигурации пакета и повторно разверните задание. Применение изменений только к конфигурации пакета гарантирует, что исходные файлы пакета всегда фиксируют текущую конфигурацию задания.
Однако если необходимо внести немедленные изменения в задание, можно отключить задание от конфигурации пакета, чтобы включить редактирование параметров задания в пользовательском интерфейсе. Чтобы отключить задание, нажмите кнопку "Отключиться от источника". В диалоговом окне "Отключение от источника" нажмите кнопку "Отключить", чтобы подтвердить.
Любые изменения, внесенные в задание в пользовательском интерфейсе, не применяются к конфигурации пакета. Чтобы применить изменения в пользовательском интерфейсе к пакету, необходимо вручную обновить конфигурацию пакета. Чтобы повторно подключить задание к конфигурации пакета, повторно разверните задание с помощью пакета.
Экспорт результатов выполнения задания
Вы можете экспортировать результаты выполнения записной книжки и журналы выполнения заданий для всех типов заданий.
Экспорт результатов выполнения ноутбука
Вы можете сохранять выполнения заданий путем экспорта их результатов. Для выполнения заданий записной книжки можно экспортировать подготовленную записную книжку, которую затем можно будет импортировать в рабочую область Azure Databricks.
Чтобы экспортировать результаты выполнения записной книжки для задания, состоящего из одной задачи, выполните следующие действия:
- На странице сведений о задании щелкните ссылку Просмотр сведений для соответствующего выполнения в столбце Выполнение таблицы Завершенные выполнения (за последние 60 дней) .
- Нажмите кнопку Экспорт в HTML.
Чтобы экспортировать результаты выполнения записной книжки для задания с несколькими задачами, выполните следующие действия:
- На странице сведений о задании щелкните ссылку Просмотр сведений для соответствующего выполнения в столбце Выполнение таблицы Завершенные выполнения (за последние 60 дней) .
- Щелкните задачу записной книжки, которую нужно экспортировать.
- Нажмите кнопку Экспорт в HTML.
Экспорт журналов выполнения заданий
Вы также можете экспортировать журналы для выполнения задания. Вы можете настроить задание для автоматической доставки журналов в DBFS при настройке вычислений работ (см. справочник по конфигурации вычислений) или через API заданий. См. объект new_cluster.cluster_log_conf в тексте запроса, передаваемый в операцию Создать задачу (POST /jobs/create) в API заданий.