Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Синтаксический анализ документов использует современные методы исследования для извлечения и визуализации структурированных данных из широкого спектра типов документов, включая, но не ограничивается PDF, изображениями, Word документами (DOC/DOCX) и PowerPoint файлами (PPT/PPTX). Он предназначен для обработки сложных макетов, таких как таблицы, диаграммы и содержимое смешанного текста.
Синтаксический анализ документов основан на ai_parse_document функции и включает пользовательский интерфейс, позволяющий анализировать документы и немедленно проверять их структуру с помощью форматированных текстовых или структурированных выходных данных JSON.
Требования
- Рабочая область, которая включает в себя следующее:
- Бессерверные вычисления включены. См. требования к бессерверным вычислениям.
- Каталог Unity включен. См. Включение рабочей области для каталога Unity.
- Доступ к бессерверной политике использования с ненулевой бюджетом.
- Эта функция доступна только в некоторых регионах, см. сведения о доступности функций ИИ.
- Эта
ai_parse_documentфункция также доступна для рабочих областей с модулем расширенной безопасности и соответствия требованиям.
- Эта
Анализ документов
Используйте синтаксический анализ документов, чтобы проанализировать документы и визуализировать их структуру.
- Перейдите к
Агенты в левой панели навигации вашего рабочего пространства.
- Нажмите Создать агента>Анализ документа.
- Выберите исходный документ. Вы можете загрузить файл или выбрать его из существующего каталога Unity Catalog. Поддерживаемые форматы: PDF, изображения, DOC/DOCX и PPT/PPTX.
- Щелкните Разобрать документ.
Анализ документа может занять несколько минут. По завершении синтаксический анализ документов отображает исходный документ слева и проанализированный документ справа. Вы можете просмотреть проанализированный документ как форматированный текст или необработанный JSON.
Результаты обработки и запроса
Чтобы просмотреть ai_parse_document запрос и запустить его в дополнительных документах, нажмите кнопку "Использовать агент " и выберите команду "Выполнить запрос" из редактора SQL или записной книжки. Запрос можно изменить, чтобы указать том или таблицу, в которых хранятся документы.
Document Parsing предоставляет интерфейс для функции ai_parse_document SQL. Дополнительные примеры и сведения см. на ai_parse_document странице справки.
Ограничения
Смотрите ai_parse_document ограничения.