什么是 Azure AI 文档智能?

重要

  • 使用文档智能选公共预览版,可以提前使用目前正处于开发状态的功能。
  • 在正式发布 (GA) 之前,根据用户反馈,功能、方法和流程可能会发生更改。
  • 文档智能客户端库的公共预览版默认为 REST API 版本 2023-10-31-preview

此内容适用于:选中标记v4.0(预览版) | 先前版本:蓝色复选标记v3.1 (GA)蓝色复选标记v3.0 (GA)蓝色复选标记v2.1 (GA)

此内容适用于:选中标记v3.1 (GA) | 最新版本:紫色复原标记v4.0(预览版) | 先前版本:蓝色复选标记v3.0蓝色复选标记v2.1

此内容适用于:选中标记v3.0 (GA) | 最新版本:紫色复原标记v4.0(预览版)紫色复原标记v3.1(预览版) | 先前版本:蓝色复选标记v2.1

此内容适用于:选中标记v2.1 | 最新版本:蓝色复选标记v4.0(预览版)

注意

表单识别器现在称为 Azure AI 文档智能!

  • 截至 2023 年 7 月,Azure AI 服务包含之前称为认知服务和 Azure 应用 AI 服务的所有内容。
  • 定价不变。
  • Azure 计费、成本分析、价目表和价格 API 中将继续使用名称“认知服务”和“Azure 应用 AI”。
  • 在 v3.1(含)之前,应用程序编程接口 (API) 或 SDK 没有中断性变更。 从 v4.0 开始,API 和 SDK 已更新为文档智能。
  • 某些平台仍在等待命名更新。 我们的文档中提及的所有表单识别器或文档智能均指同一项 Azure 服务。

Azure AI 文档智能是一项基于云的 Azure AI 服务,支持构建智能文档处理解决方案。 大量数据(跨越各种数据类型)存储在表单和文档中。 文档智能使你能够有效地管理收集和处理数据的速度,它还是改进操作、制定明智的数据驱动决策和启发式创新的关键。

| ✔️ 文档分析模型 | ✔️ 预生成模型 | ✔️ 自定义模型 |

文档分析模型

文档分析模型支持从表单和文档中提取文本,并返回结构化的业务就绪内容,以便为组织的操作、使用或进度做好准备。


读取 | 提取打印的
和手写的文本。


布局 | 提取文本、表
和文档结构


读取 | 提取打印的
和手写的文本。


布局 | 提取文本、表
和文档结构


常规文档 | 提取文本、
结构和键值对。

预生成的模型

通过预生成模型,可以在应用和流中添加智能文档处理,而无需训练和生成自己的模型。


发票 | 提取客户
和供应商详细信息。


收据 | 提取销售
交易详细信息。


标识 | 提取标识
和验证详细信息。


医疗保险卡 | 提取医疗
保险详细信息。


合同 | 提取协议
和参与方详细信息。


美国税务 W-2 表单 | 提取应纳税
所得详细信息。


美国税务 1098 表 | 提取抵押贷款利息详细信息。


美国税务 1098-E 表单 | 提取学生贷款利息详细信息。


美国税务 1098-T 表 | 提取符合条件的学费详细信息。


美国税务 1099 表单 | 从 1099 表单的变体中提取信息。


发票 | 提取客户
和供应商详细信息。


收据 | 提取销售
交易详细信息。


标识 | 提取标识
和验证详细信息。


医疗保险卡 | 提取医疗保险详细信息。


名片 | 提取业务联系人详细信息。


合同 | 提取协议
和参与方详细信息。


美国税务 W-2 表单 | 提取应纳税
所得详细信息。


美国税务 1098 表 | 提取抵押贷款利息详细信息。


美国税务 1098-E 表单 | 提取学生贷款利息详细信息。


美国税务 1098-T 表 | 提取符合条件的学费详细信息。

自定义模式

  • 自定义模型使用标记的数据集进行训练,以便从特定于你的用例的表单和文档中提取不同的数据。
  • 可以组合独立的自定义模型来创建组合模型。
  • 提取模型
    ✔️ 自定义提取模型经过训练,可从文档中提取带标签的字段。


自定义模板 | 从静态布局中提取数据。


自定义组合 | 使用模型集合提取数据。

  • 分类模型
    ✔️ 自定义分类器在调用提取模型之前识别文档类型。


自定义分类器 | 在调用提取模型前
识别指定的文档类型(类)。

附加功能

文档智能支持可选功能,这些功能可以根据文档提取方案启用和禁用。 以下加载项功能适用于 2023-07-31 (GA) 及更高版本:

文档智能支持可选功能,这些功能可以根据文档提取方案启用和禁用。 以下加载项功能适用于 2023-10-31-preview 及更高版本:

分析功能

模型 ID 内容提取 段落 段落角色 选择标记 键值对 语言 条形码 文档分析 公式* 字体样式* 高分辨率* 查询字段
prebuilt-read O O O O O
预生成布局 O O O O O O
prebuilt-idDocument O O O O O
预生成的发票 O O O O O O
prebuilt-receipt O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(变体) O O O O O
prebuilt-contract O O O O O
{ customModelName } O O O O O
prebuilt-document(已弃用
2023-10-31-preview
O O O O O
prebuilt-businessCard(已弃用
2023-10-31-preview

✓ - 已启用
O - 可选
* - 高级功能会产生额外费用。

模型和开发选项

注意

文档智能服务 v3.0 支持以下文档理解模型和开发选项。

你可使用文档智能来自动执行应用程序和工作流中的文档处理、增强数据驱动的策略并丰富文档搜索功能。 请使用下表中的链接详细了解每种模型并浏览开发选项。

读取

使用文档智能工作室的读取模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
prebuilt-read • 从文档中提取文本
数据提取
• 数字化任何文档。
● 合规性和审核。
● 在翻译前处理手写笔记。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Layout

使用文档智能工作室的布局模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
预生成布局 • 从文档中提取文本和布局信息。
数据提取
• 按结构编制文档索引和检索。
• 财务和医疗报告分析。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

常规文档(已在 2023-10-31-preview 中弃用)

使用文档智能工作室的常规文档模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
预生成文档 ● 从文档中提取文本、布局和键值对。
数据和字段提取
● 键值对提取。
• 表单处理。
• 调查数据收集和分析。
文档智能工作室
REST API

发票

使用文档智能工作室的发票模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
预生成的发票 ● 从发票中提取关键信息。
数据和字段提取
• 应付帐款处理。
• 自动税务记录和报告。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

回执

使用文档智能工作室的收据模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
prebuilt-receipt ● 从收据中提取关键信息。
数据和字段提取
● 收据模型 v3.0 支持处理单页酒店收据。
• 费用管理。
• 消费者行为数据分析。
• 客户忠诚度计划。
• 商品退货处理。
• 自动税务记录和报告。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

标识 (ID)

使用文档智能工作室的标识 (ID) 文档模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
prebuilt-idDocument ● 从护照和身份证中提取关键信息。
文档类型
• 从美国驾照中提取准驾车型、限制和车辆分类信息。
• 了解客户 (KYC) 金融服务指南合规性。
• 医疗帐户管理。
• 标识检查点和网关。
● 酒店注册。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

医疗保险卡

使用文档智能工作室的医疗保险卡模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
prebuilt-healthInsuranceCard.us ● 从美国医保卡中提取关键信息。
数据和字段提取
• 覆盖范围和资格验证。
• 预测建模。
• 基于值的分析。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

合同模型

使用文档智能工作室的合同模型提取的屏幕截图。

模型 ID 说明 开发选项
prebuilt-contract 提取合同协议和参与方详细信息。 文档智能工作室
REST API

美国税务 W-2 模型

使用文档智能工作室的 W-2 模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
prebuilt-tax.us.W-2 ● 从 IRS 美国 W2 税单(2018-2021 年)中提取关键信息。
数据和字段提取
• 自动化税务文档管理。
• 抵押贷款申请处理。
文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

美国税务 1098 表

在文档智能工作室中处理的美国 1098 税务表的屏幕截图。

模型 ID 说明 开发选项
prebuilt-tax.us.1098 提取抵押贷款利息信息和详细信息。 文档智能工作室
REST API

美国税务 1098-E 表

在文档智能工作室中处理的美国 1098-E 税务表的屏幕截图。

模型 ID 说明 开发选项
prebuilt-tax.us.1098E 提取学生贷款信息和详细信息。 文档智能工作室
REST API

美国税务 1098-T 表

在文档智能工作室中处理的美国 1098-T 税务表的屏幕截图。

模型 ID 说明 开发选项
prebuilt-tax.us.1098T 提取学费信息和详细信息。 文档智能工作室
REST API

美国税务 1099(和变体)表单

在文档智能工作室中处理的美国 1099 税务表的屏幕截图。

模型 ID 说明 开发选项
prebuilt-tax.us.1099(变体) 提取 1099 表单变体中的信息。 文档智能工作室
REST API

名片

使用文档智能工作室的名片模型分析的屏幕截图。

模型 ID 说明 自动化用例 开发选项
prebuilt-businessCard ● 从名片中提取关键信息。
数据和字段提取
● 销售线索和营销管理。 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript

自定义模型概述

使用文档智能工作室的自定义模型培训的屏幕截图。

关于 说明 自动化用例 开发选项
自定义模型 根据从一组有代表性的训练文档集创建的模型,将表单和文档中的信息提取到结构化数据中。 从特定于企业和用例的表单和文档中提取不同数据。 文档智能工作室
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自定义模板

使用文档智能工作室的自定义模板模型分析的屏幕截图。

注意

若要训练自定义模板模型,请将 buildMode 属性设置为 template。 有关详细信息,请参阅训练模板模型

关于 说明 自动化用例 开发选项
自定义模板模型 自定义模板模型从结构化文档和半结构化文档中提取带标签的值和字段。
使用定义的视觉模板或常见的视觉布局、表单从高度结构化的文档中提取关键数据。 文档智能工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

自定义组合

文档智能工作室中的组合自定义模型列表的屏幕截图。

关于 说明 自动化用例 开发选项
组合自定义模型 组合模型的创建方式是采用自定义模型的集合并将其分配到基于你的表单类型构建的单个模型。 如果训练多个模型,并且要对它们进行分组以分析相似的表单类型(例如采购订单),那么此方法很有用。 文档智能工作室
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

自定义分类模型

{alt-text}

关于 说明 自动化用例 开发选项
组合分类模型 自定义分类模型结合了布局和语言功能,以检测、识别和分类输入文件中的文档。 • 打包的贷款申请,其中包含申请表、工资单和银行对帐单。
• 扫描的发票集合。
文档智能工作室
REST API

Azure AI 文档智能是一项基于云的 Azure AI 服务,便于开发人员构建智能文档处理解决方案。 文档智能应用基于机器学习的光学字符识别 (OCR) 和文档理解技术从文档中提取文本、表格、结构和键值对。 你还可以标记和训练自定义模型,以自动从结构化、半结构化和非结构化文档中提取数据。 若要详细了解每种模型,请参阅概念文章:

模型类型 模型名称
文档分析模型 布局分析模型
预生成的模型 发票模型
收据模型
身份证件 (ID) 模型
名片模型
自定义模式 自定义模型
组合模型

此内容适用于:选中标记v2.1 | 最新版本:蓝色复选标记v4.0(预览版)

文档智能模型和开发选项

提示

  • 若要获得增强的体验和高级模型质量,请尝试文档智能 v3.0 工作室
  • v3.0 工作室支持任何使用 v2.1 标记数据进行训练的模型。
  • 若要详细了解如何从 v2.1 迁移到 v3.0,可参阅 API 迁移指南。

注意

文档智能服务 v2.1 支持以下模型和开发选项。

请使用下表中的链接详细了解每种模型并浏览 API 参考信息:

型号 说明 开发选项
布局分析 从表单和文档中提取和分析文本、选择标记和边界框坐标。 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器
自定义模型 提取和分析与特定业务数据和用例相关的表单和文档中的数据。 文档智能标记工具
REST API
示例标记工具
文档智能 Docker 容器
发票模型 自动提取和处理销售发票中的重要信息。 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器
收据模型 自动提取和处理销售收据中的重要信息。 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器
身份证件 (ID) 模型 自动提取和处理美国驾驶证和国际护照中的重要信息。 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器
名片模型 自动提取和处理名片中的重要信息。 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器

数据隐私和安全性

与所有 AI 服务一样,使用文档智能服务的开发人员应该了解针对客户数据的 Azure 政策。 请查看文档智能的数据、隐私和安全性页面。

后续步骤