Udostępnij za pośrednictwem


Analizowanie dokumentów

Analizowanie dokumentów wykorzystuje najnowocześniejsze techniki badawcze do wyodrębniania i wizualizowania danych strukturalnych z szerokiego zakresu typów dokumentów, w tym plików PDF, obrazów, dokumentów Word (DOC/DOCX) i plików PowerPoint (PPT/PPTX). Jest ona przeznaczona do obsługi złożonych układów, takich jak tabele, wykresy i mieszana zawartość obrazu tekstowego.

Analizowanie dokumentów jest oparte na ai_parse_document funkcji i zawiera interfejs użytkownika, który umożliwia analizowanie dokumentów i natychmiastowe sprawdzanie ich struktury za pomocą sformatowanego tekstu lub ustrukturyzowanych danych wyjściowych JSON.

Wymagania

Analizowanie dokumentów

Użyj analizy dokumentów, aby przetwarzać swoje dokumenty i wizualizować ich strukturę.

  1. Przejdź do ikony Agenci.Agenci w okienku nawigacji po lewej stronie obszaru roboczego.
  2. Kliknij Utwórz agenta>Analizowanie dokumentów.
  3. Wybierz dokument źródłowy. Możesz przekazać plik lub wybrać go z istniejącego katalogu Unity Catalog. Obsługiwane formaty to: PDF, images, DOC/DOCX i PPT/PPTX.
  4. Kliknij pozycję Przeanalizuj dokument.

Analizowanie dokumentu może potrwać kilka minut. Po zakończeniu analizowanie dokumentów pokazuje dokument źródłowy po lewej stronie i przeanalizowany dokument po prawej stronie. Możesz wyświetlić przeanalizowany dokument jako sformatowany tekst lub nieprzetworzony kod JSON.

Interfejs użytkownika analizowania dokumentów przedstawiający dokument źródłowy i analizowany obok siebie

Przetwarzanie i wyniki zapytań

Aby wyświetlić ai_parse_document zapytanie i uruchomić je w kolejnych dokumentach, kliknij Użyj agenta i wybierz, czy chcesz uruchomić zapytanie w edytorze SQL, czy w notesie. Możesz edytować zapytanie, aby wskazywało wolumin lub tabelę dokumentów, w których są przechowywane.

Analizowanie dokumentów udostępnia interfejs użytkownika do funkcji SQL ai_parse_document. Zobacz stronę referencyjną, ai_parse_document aby uzyskać bardziej zaawansowane przykłady i szczegóły.

Ograniczenia

Zobacz ai_parse_document ograniczenia.