文档智能自定义模型生命周期

此内容适用于:选中标记v4.0(预览版)选中标记v3.1 (GA)

借助 v3.1 (GA) 及更高版本的 API,自定义模型引入了 expirationDateTime 属性,该属性为使用 3.1 API 或更高版本训练的每个模型设置。 自定义模型依赖于布局 API 版本的 API 版本和模型生成操作的 API 版本。 为获得最佳结果,请继续使用模型训练使用的 API 版本以处理所有分析请求。 本指南适用于所有文档智能自定义模型,包括提取和分类模型。

使用 GA API 版本训练的模型

借助 v3.1 API,自定义模型引入了新的模型过期属性。 模型过期时间设置为从为使用 GA API 生成模型的所有请求生成模型之日起两年。 要在过期日期之后继续使用模型,需要使用当前 GA API 版本训练模型。 API 版本可以是最初训练模型时使用的 API 版本,也可以是更高的 API 版本。 下图演示了需要重新训练即将过期或已过期的模型时使用的选项。

显示如何选择 API 版本并重新训练模型的屏幕截图。

使用预览版 API 版本训练的模型

对于使用预览版 API 版本的生成请求,到期日期设置为自生成模型之日起的三个月。 使用预览版 API 训练的模型不应在生产中使用,应在相应的 GA API 版本可用后重新训练。 预览版 API 版本和 GA API 版本之间的兼容性并不总是得到维护。 应预料到,预览版 API 停用后,使用预览版 API 版本训练的模型无法使用。

预览版 API 通常在相应 GA API 可用后的三个月内停用。

查看模型到期日期

GET 模型 API 返回模型详细信息,包括expirationDateTime属性。

GET /documentModels/{customModelId}?api-version={apiVersion}
{
  "modelId": "{customModelId}",
  "description": "{customModelDescription}",
  "createdDateTime": "2021-09-24T12:54:35Z",
  "expirationDateTime": "2023-01-01T00:00:00Z",
  "apiVersion": "2023-07-31",
  "docTypes": { ... }
}

重新训练模型

要使用较新的 API 版本重新训练模型,请确保训练数据集中文档的布局结果与生成模型请求的 API 版本相对应。 例如,如果计划使用v3.1:2023-07-31 API 版本生成模型,还应使用 v3.1:2023-07-31 API 版本生成训练数据集中的相应 *.ocr.json 文件。 ocr.json 文件通过在训练数据集上运行布局生成。 要验证布局结果的版本,请检查 ocr.json 文档analyzeResult中的apiVersion属性。

后续步骤

了解如何创建和组合自定义模型: