应该选择哪个模型?

此内容适用于:选中标记v3.1 (GA) | 以前的版本:蓝色复选标记v3.0

此内容适用于:选中标记v3.0 (GA) | 最新版本:紫色复原标记v3.1

Azure AI 文档智能支持多种模型,因此可以将智能文档处理添加到应用程序,并对工作流进行优化。 选择正确的模型对于确保企业取得成功至关重要。 在本文中,我们将探索可用的文档智能模型,并提供有关如何为项目选择最佳解决方案的指导。

以下决策图表突出显示了每个文档智能 v3.0 支持模型的功能,并帮助你选择最佳模型来满足应用程序的需求和要求。

重要

请务必查看支持的语言页面,了解支持的语言文本和按功能提取的字段。

预训练的文档分析模型

文档类型 示例 要提取的数据 最佳解决方案
通用文档. 合同或信件。 你希望提取的主要是书面或打印的文本行、字词、位置和检测到的语言。 读取 OCR 模型
包含结构信息的文档 报告或研究。 除了书面或打印文本,还需要提取结构信息,例如表格、选择标记、段落、标题、标题和副标题。 布局分析模型
结构化或半结构化文档,其中包含格式化为字段(键)和值的内容。 表单或文档,这是企业或行业中常用的标准化格式,例如信用申请或调查。 你需要提取字段和值,包括场景特定的预生成模型未涵盖的字段和值, 而无需训练自定义模型。 **启用了可选查询字符串参数 features=keyValuePairs 的布局分析模型**

预训练的特定于方案的模型

文档类型 要提取的数据 最佳解决方案
US W-2 税表 你希望提取关键信息,如薪酬、工资和预扣税款。 美国税务 W-2 模型
美国税务 1098 表 你想要提取抵押贷款利息详细信息,如本金、积分和税款。 美国税务 1098 表
美国税务 1098-E 表 你想要提取学生贷款利息详细信息,例如贷款人和利息金额。 美国税务 1098-E 表
美国税务 1098T 表 你想要提取符合条件的学费详细信息,例如奖学金调整、学生身份和贷款人信息。 美国税务 1098-T 模型
美国税务 1099(变体)表单 你想要从 1099 表单及其变体(A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB)中提取信息。 美国税务 1099 模型
美国税务 1040(变体)表单 你想要从 1040 表单及其变体中提取信息(单据 1、单据 2、单据 3、单据 8812、单据 A、单据 B、单据 C、单据 D、单据 E、单据 E、单据 EIC、单据 F、单据 H、单据 J、单据 R、单据 SE、单据高级)。 美国税务 1040 模型
合同(相关方之间的法律协议)。 你想要提取合同协议详细信息,例如参与方、日期和间隔。 合同模型
保险卡或医疗保险 ID 你希望提取关键信息,例如保险公司、会员 ID、处方保险和团体。 医疗保险卡模型
信用卡/借记卡 你想要提取关键信息银行卡,如卡号和银行名称。 信用卡/借记卡模型
结婚证 你想要从结婚证中提取关键信息。 结婚证模型
发票或帐单报表。 你希望提取关键信息,例如客户姓名、帐单邮寄地址和到期金额。 发票模型
收据、代金券或单页酒店收据。 你希望提取关键信息,如商家名称、交易日期和交易总额。 收据模型
身份证件 (ID),例如美国驾照或国际护照。 你想要提取名字、姓氏、出生日期、地址和签名等关键信息。 身份证件 (ID) 模型
美国抵押贷款 1003 你想要从统一住宅贷款申请表中提取关键信息。 1003 表单模型
美国抵押贷款 1008 你想要从统一认购和传输汇总表中提取关键信息。 1008 表单模型
美国按揭过户信息披露 你想要从按揭过户信息披露表单中提取关键信息。 按揭过户信息披露表单模型
包含结构化、半结构化和/或非结构化元素的混合类型文档 你想要提取未由预生成或常规文档模型提取的键值对、选择标记、表、签名字段和选定区域。 自定义模型

提示

  • 如果你仍不确定要使用哪个预先训练的模型,请在启用可选的查询字符串参数 features=keyValuePairs 的情况下尝试“布局模型”
  • 布局模型由“读取 OCR”引擎提供支持,用于检测页面、表、样式、文本、行、字词、位置和语言。

自定义提取模型

训练集 示例文档 最佳解决方案
具有静态布局的结构化、一致的文档 结构化表单,例如问卷或申请。 自定义模板模型
结构化、半结构化和非结构化文档。 ● 结构化 → 调查表
● 半结构化 → 发票
● 非结构化 → 信件
几个模型的集合,每个模型都在相似类型的文档上进行训练 ● 供应采购订单
● 设备采购订单
● 家具采购订单
全部组成单个模型
组合自定义模型

自定义分类模型

训练集 示例文档 最佳解决方案
至少两种类型的文档 窗体、字母或文档 自定义分类模型

后续步骤