信息提取概述
注释
有关更多详细信息,请参阅 “文本和图像 ”选项卡!
信息提取是一种工作负载,它结合了多种 AI 技术从内容中提取数据(通常是数字文档)。 全面的信息提取解决方案包括通过计算机视觉元素检测图像数据中的文本,以及使用机器学习或越来越多使用生成性人工智能,以语义方式将提取的文本映射到特定的数据字段。
- 使用光学字符识别(OCR)从图像中检测和提取文本。
- 从 OCR 结果中识别值并将其映射到数据字段。
例如,AI 提供支持的支出声明处理解决方案可能会从收据自动提取相关字段,以更高效地处理索赔。
| 已扫描收据 | 提取的数据 |
|---|---|
|
|
选择正确的方法
规划信息提取解决方案时,请务必考虑系统必须满足的要求和约束。 一些关键注意事项包括:
文档特征。 需要从中提取数据的文档是整个解决方案的基础。 请考虑以下因素:
- 布局一致性:标准化表单支持基于模板的方法,而需要处理多种格式和布局可能需要更复杂的基于机器学习的解决方案。
- 处理量要求:高容量数据处理受益于在优化系统硬件上运行的自动机器学习模型。
- 准确性要求:关键应用程序可能需要人工循环验证。
技术基础结构要求和约束。 解决方案需要硬件和软件基础结构才能运行。 请考虑以下因素:
- 安全和隐私:正在处理的文档可能包含敏感或机密数据。 解决方案必须包括足够的措施,以保护对数据的访问,并符合存储和处理受保护数据的任何行业要求。
- 处理能力:信息提取解决方案中常用的深度学习和生成 AI 模型需要大量的计算资源。
- 延迟要求:实时处理可能会限制模型复杂性。
- 可伸缩性需求:基于云的解决方案为可变工作负荷提供更好的可伸缩性。
- 集成复杂性:考虑 API 兼容性和数据格式要求。
小窍门
在许多情况下,可以使用软件服务(如 Microsoft Foundry 工具中的 Azure 文档智能和 Microsoft Foundry 工具中的 Azure 内容理解)构建信息提取解决方案。 使用这些服务作为解决方案的基础可以大大减少所需的开发工作,同时提供高度可扩展、业界验证的性能、准确性和集成功能。