什么是 Azure 表单识别器?
本文适用于:表单识别器 v3.0。 早期版本:表单识别器 v2.1
Azure 表单识别器是基于云的 Azure 应用的 AI 服务,供开发人员用来构建智能文档处理解决方案。 表单识别器应用基于机器学习的光学字符识别 (OCR) 和文档理解技术分类文档、从文档中提取文本、表格、结构和键值对。 你还可以标记和训练自定义模型,以自动从结构化、半结构化和非结构化文档中提取数据。 若要详细了解每种模型,请参阅概念文章:
模型类型 | 模型名称 |
---|---|
文档分析模型 | ● 读取 OCR ● 布局分析 ● 常规文档 |
预生成的模型 | ● W-2 表 ● 发票 ● 收据 ● 标识 (ID) 文档 ● 名片 |
自定义模式 | • 自定义模型概述 ● 提取模型 ○ 自定义模板 ○ 分类器模型 ○ 组合模型 |
封闭预览模型 要在表单识别器工作室中请求对封闭预览模型 的访问权限,请填写并提交 表单识别器个人预览版请求表单。 |
● 包含查询字段的常规文档 ● 合同 ● 疫苗接种卡 ● US 1098 税务表 ● US 1098-E 税务表 ● US 1098-T 税务表 |
应该使用哪种表单识别器模型?
本部分帮助你确定应将哪种表单识别器 v3.0 支持的模型用于你的应用程序:
文档类型 | 要提取的数据 | 文档格式 | 最佳解决方案 |
---|---|---|---|
一般文档,例如合同或信件。 | 你希望提取的主要是文本行、单词、位置和检测到的语言。 | 文档以受支持的语言编写或打印。 | 读取 OCR 模型 |
包含结构信息(例如报表或研究)的文档。 | 除文本外,还需要提取结构信息,如表格、选择标记、段落、标题、标头和副标题。 | 文档以受支持的语言编写或打印 | 布局分析模型 |
结构化或半结构化文档,包含格式为字段和值的内容,如信贷申请表或调查表单。 | 你需要提取字段和值,包括场景特定的预生成模型未涵盖的字段和值, 而无需训练自定义模型。 | 表单或文档是企业或行业常用的标准化格式,采用受支持的语言打印。 | 常规文档模型 |
U.S. W-2 表单 | 你希望从 US W2 税单中提取关键信息,如薪酬、工资和预扣税款。 | W-2 文档采用美国英语 (en-US) 文本。 | W-2 模型 |
发票 | 你希望提取关键信息,例如客户姓名、帐单地址和发票到期金额。 | 发票文档以受支持的语言编写或打印。 | 发票模型 |
回执 | 你想要从销售或单页酒店收据中提取关键信息,如商家名称、交易日期和交易总额。 | 收据以受支持的语言编写或打印。 | 收据模型 |
身份证件 (ID),例如护照或驾照。 | 你想要从美国驾照或国际护照中提取关键信息,例如名字、姓氏和出生日期。 | ID 文档是美国驾照或国际护照(非签证)的传记页面。 | 身份证件 (ID) 模型 |
名片 | 你想要从名片中提取关键信息,例如名字、姓氏、公司名称、电子邮件地址和电话号码。 | 名片文档采用英语或日语文本。 | 名片模型 |
应用程序特定文档 | 你想要提取未由预生成或常规文档模型提取的键值对、选择标记、表、签名字段和选定区域。 | 你拥有结构化、半结构化和/或非结构化元素的各种文档。 | 自定义提取模型 |
混合类型文档 | 你想要对文档进行分类或将文件拆分为单独的文档。 | 你拥有结构化、半结构化和/或非结构化元素的各种文档。 | 自定义分类模型 |
提示
- 如果仍然不确定要使用哪种模型,请尝试使用常规文档模型来提取键值对。
- 常规文档模型由读取 OCR 引擎提供支持,用于检测文本行、字词、位置和语言。
- 常规文档还提取与文档布局模型相同的数据(页面、表格、样式)。
文档处理模型和开发选项
注意
表单识别器服务 v3.0 支持以下文档理解模型和开发选项。
可以使用表单识别器自动处理应用程序和工作流中的文档处理,增强数据驱动的策略并丰富文档搜索功能。 请使用下表中的链接详细了解每种模型并浏览 API 参考信息。
型号 | 说明 | 自动化用例 | 开发选项 |
---|---|---|---|
读取 OCR 模型 | 提取文本行、字词、检测到的语言和手写样式(如果检测到)。 | ● 合同处理。 ● 财务或医疗报告处理。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
常规文档模型 | 提取文本、表、结构和键值对。 | ● 键值对提取。 • 表单处理。 • 调查数据收集和分析。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
布局分析模型 | 从表单和文档中提取文本、选择标记和表结构及其边界框坐标。 布局 API 已更新为预生成的模型。 |
• 按结构编制文档索引和检索。 • 在 OCR 分析之前预处理。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
自定义模型(已更新) | 分类、提取和分析与特定业务数据和用例相关的表单和文档中的数据。 自定义模型 API v3.0 支持两种模型类型:• 自定义提取模型用于分析表单或文档,以及提取特定字段和表。 自定义模板和自定义神经网络是两种类型的自定义提取模型。 | • 识别和提取受法规变化或市场事件影响的特定于业务的文档中的数据。 • 识别和分析以前忽略的唯一数据。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
W-2 表单 | 提取 W-2 表单上每个框中报告的信息。 | • 自动化税务文档管理。 • 抵押贷款申请处理。 |
• 表单识别器工作室● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
发票模型 | 自动提取和处理销售发票中的重要信息。 | • 应付帐款处理。 • 自动税务记录和报告。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK |
收据模型(已更新) | 自动数据处理和从销售收据提取关键信息。 收据模型 v3.0 支持处理单页酒店收据。 |
• 费用管理。 • 消费者行为数据分析。 • 客户忠诚度计划。 • 商品退货处理。 • 自动税务记录和报告。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
身份证件 (ID) 模型(更新版) | 自动数据处理和提取美国驾照和国际护照中的关键信息。 预内置 ID 文档 API 支持提取美国驾照中的违章记录、速度限制和车辆分类。 |
• 了解客户 (KYC) 金融服务指南合规性。 • 医疗帐户管理。 • 标识检查点和网关。 ● 酒店注册。 |
• 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
名片模型 | 自动提取和处理名片中的重要信息。 | ● 销售线索和营销管理。 | • 表单识别器工作室 ● REST API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
本文适用于:表单识别器 v2.1。 更高版本:表单识别器 v3.0
Azure 表单识别器是基于云的 Azure 应用的 AI 服务,供开发人员用来构建智能文档处理解决方案。 表单识别器应用基于机器学习的光学字符识别 (OCR) 和文档理解技术从文档中提取文本、表格、结构和键值对。 你还可以标记和训练自定义模型,以自动从结构化、半结构化和非结构化文档中提取数据。 若要详细了解每种模型,请参阅概念文章:
模型类型 | 模型名称 |
---|---|
文档分析模型 | ● 布局分析模型 |
预生成的模型 | ● 发票模型 ● 收据模型 ● 身份证件 (ID) 模型 ● 名片模型 |
自定义模式 | ● 自定义模型 ● 组合模型 |
我应使用哪个文档处理模型?
本部分帮助你确定应将哪种表单识别器 v2.1 支持的模型用于你的应用程序:
文档类型 | 要提取的数据 | 文档格式 | 最佳解决方案 |
---|---|---|---|
包含结构信息(例如报表或研究)的文档。 | 除文本外,你还需要提取结构信息,例如表格和选择标记。 | 文档以受支持的语言编写或打印 | 布局分析模型 |
发票 | 你希望提取关键信息,例如客户姓名、帐单地址和发票到期金额。 | 发票文档以受支持的语言编写或打印。 | 发票模型 |
回执 | 你想要从销售或单页酒店收据中提取关键信息,如商家名称、交易日期和交易总额。 | 收据以受支持的语言编写或打印。 | 收据模型 |
身份证件 (ID),例如护照或驾照。 | 你想要从美国驾照或国际护照中提取关键信息,例如名字、姓氏和出生日期。 | ID 文档是美国驾照或国际护照(非签证)的传记页面。 | ID 文档模型 |
名片 | 你想要从名片中提取关键信息,例如名字、姓氏、公司名称、电子邮件地址和电话号码。 | 名片文档采用英语或日语文本。 | 名片模型 |
混合类型文档 | 你想要提取未由预生成或常规文档模型提取的键值对、选择标记、表、签名字段和选定区域。 | 你拥有结构化、半结构化和/或非结构化元素的各种文档。 | 自定义模型 |
表单识别器模型和开发选项
提示
- 若要获得增强的体验和高级模型质量,请尝试表单识别器 v3.0 工作室。
- v3.0 工作室支持任何使用 v2.1 标记数据进行训练的模型。
- 若要详细了解如何从 v2.1 迁移到 v3.0,可参阅 API 迁移指南。
注意
表单识别器服务 v2.1 支持以下模型和开发选项。
请使用下表中的链接详细了解每种模型并浏览 API 参考信息:
型号 | 说明 | 开发选项 |
---|---|---|
布局分析 | 从表单和文档中提取和分析文本、选择标记和边界框坐标。 | • 表单识别器标记工具 ● REST API ● 客户端库 SDK ● 表单识别器 Docker 容器 |
自定义模型 | 提取和分析与特定业务数据和用例相关的表单和文档中的数据。 | • 表单识别器标记工具 ● REST API ● 示例标记工具 ● 表单识别器 Docker 容器 |
发票模型 | 自动提取和处理销售发票中的重要信息。 | • 表单识别器标记工具 ● REST API ● 客户端库 SDK ● 表单识别器 Docker 容器 |
收据模型 | 自动提取和处理销售收据中的重要信息。 | • 表单识别器标记工具 ● REST API ● 客户端库 SDK ● 表单识别器 Docker 容器 |
身份证件 (ID) 模型 | 自动提取和处理美国驾驶证和国际护照中的重要信息。 | • 表单识别器标记工具 ● REST API ● 客户端库 SDK ● 表单识别器 Docker 容器 |
名片模型 | 自动提取和处理名片中的重要信息。 | • 表单识别器标记工具 ● REST API ● 客户端库 SDK ● 表单识别器 Docker 容器 |
数据隐私和安全性
与所有 AI 服务一样,使用表单识别器服务的开发人员应该了解针对客户数据的 Azure 政策。 请参阅我们的表单识别器的数据、隐私和安全页。
后续步骤
尝试使用表单识别器示例标记工具来处理你自己的表单和文档
完成表单识别器快速入门,并使用你选择的开发语言开始创建文档处理应用。