文档智能组合的自定义模型

此内容适用于:选中标记v3.1 (GA) | 先前版本:蓝色复选标记v3.0蓝色复选标记v2.1

此内容适用于:选中标记v3.0 (GA) | 最新版本:紫色复原标记v3.1 | 以前的版本:蓝色复选标记v2.1

此内容适用于:选中标记v2.1

组合模型。 组合模型的创建方式是采用自定义模型的集合并将其分配到基于你的表单类型构建的单个模型。 提交文档以使用组合模型进行分析时,服务会执行分类,以确定哪个自定义模型能够最好地呈现所提交的文档。

借助组合模型,可以将多个自定义模型分配给使用单个模型 ID 调用的组合模型。 如果训练了多个模型并且要对它们进行分组以分析相似表单类型时,组合模型非常有用。 例如,组合模型可能包含为分析供应、设备和家具采购订单而进行训练的自定义模型。 可以使用组合模型为每次分析和提取确定适当的自定义模型,而不是手动尝试选择适当的模型。

  • Custom formCustom template 模型可以组合成单个组合模型。

  • 通过模型组合操作,最多可将 200 个经过训练的自定义模型分配到单个组合模型。 若要使用组合模型来分析文档,文档智能将首先对提交的表单进行分类,选择匹配度最佳的已分配模型,然后返回结果。

  • 对于自定义模板模型,可以使用自定义模板的变体或不同的表单类型来创建组合模型。 当传入的表单属于多个模板中的一个模板时,此操作非常有用。

  • 响应包含一个 docType 属性,用于指示已使用哪个组合模型分析了文档。

  • 对于 Custom neural 模型,最佳做法是将单个文档类型的所有不同变体添加到单个训练数据集中,并在自定义神经模型上进行训练。 模型组合最适合提交不同类型的文档进行分析的场景。

随着自定义分类模型的推出,你可以选择在分析前将组合模型分类模型用作显式步骤。 若要更深入地了解何时使用分类或组合模型,请参阅自定义分类模型

组合模型的限制

备注

随着自定义神经模型的引入,可组合在一起的模型的兼容性存在几项限制。

组合模型兼容性

自定义模型类型 使用 v2.1 和 v2.0 训练的模型 自定义模板模型 v3.0 自定义神经模型 3.0 自定义神经模型 v3.1
使用版本 2.1 和 v2.0 训练的模型 支持 受支持 不支持 不支持
自定义模板模型 v3.0 支持 受支持 不支持 不支持
自定义模板模型 v3.0 不支持 不支持 不支持 不支持
自定义模板模型 v3.1 不支持 不支持 不支持 不支持
自定义神经网络模型 v3.0 不支持 不支持 支持 支持
自定义神经网络模型 v3.1 不支持 不支持 支持 支持
  • 若要组合使用旧版 API(v2.1 或更低版本)训练的模型,请使用相同的标记数据集通过 v3.0 API 训练模型。 该附加事项确保 v2.1 模型可以与其他模型组合在一起。

  • 继续支持使用 API v2.1 组合的模型,这些模型无需更新。

  • 对于自定义模型,可组合的最大数量为 200 个。

开发选项

文档智能 v3.1:2023-07-31 (GA) 支持以下工具、应用程序和库:

功能 资源
自定义模型 文档智能工作室
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
组合的模型 文档智能工作室
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

文档智能 v3.0:2022-08-31 (GA) 支持以下工具、应用程序和库:

功能 资源
自定义模型 文档智能工作室
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
组合的模型 文档智能工作室
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

文档智能 v2.1 支持以下资源:

功能 资源
自定义模型 文档智能标记工具
REST API
客户端库 SDK
文档智能 Docker 容器
组合的模型 文档智能标记工具
REST API
C# SDK
Java SDK
• JavaScript SDK
Python SDK

后续步骤

了解如何创建和组合自定义模型: