自定义语音识别模型生命周期

项目
04/15/2024

将自定义语音识别模型部署到自定义终结点后，可以使用一段时间。但是当新基本模型可用时，旧模型将过期。必须基于最新基础模型定期重新创建并训练自定义模型，以利用更高的准确度和质量。

以下是一些与模型生命周期相关的关键术语：

训练：采用基础模型，并使用文本数据和/或音频数据根据你的领域/方案对其进行自定义。在某些上下文（例如 REST API 属性）中，训练也称为适应。
听录：使用模型并执行语音识别（将音频解码为文本）。
终结点：只有你能够访问的基础模型或自定义模型的特定部署。

注意

F0 语音资源使用的终结点在 7 天后删除。

过期时间线

下面是模型适应和听录的过期时间表：

在 Microsoft 创建基础模型的那个季度后的一年内，可进行训练。
在 Microsoft 创建基础模型的那个季度后的两年内，可以使用基础模型进行听录。
在你创建自定义模型的那个季度后的两年内，可以使用自定义模型进行听录。

在此上下文中，季度的结束日期为 1 月 15 日、4 月 15 日、7 月 15 日和 10 月 15 日。

模型到期时需要执行的操作

自定义模型或基本模型到期时，它不再可用于听录。可以在不停机的情况下更改自定义语音识别终结点使用的模型。

听录路由	已到期模型结果	建议
自定义终结点	语音识别请求会回退到同一区域设置的最新基本模型。你会得到结果，但识别可能无法准确听录域数据。	更新终结点的模型，如部署自定义语音识别模型指南中所述。
批量听录	已到期模型的批量听录请求会失败，并出现 4xx 错误。	在每个 Transcriptions_Create REST API 请求正文中，将 `model` 属性设置为一个尚未到期的基本模型或自定义模型。否则，请不要添加 `model` 属性，以始终使用最新的基本模型。

获取基本模型到期日期

创建自定义模型时会显示可以将基本模型用于训练的最后日期。有关详细信息，请参阅训练自定义语音识别模型。

按照以下说明获取基本模型的听录到期日期：

登录 Speech Studio。
选择“自定义语音识别”> 你的项目名称 >“部署模型”。
模型的到期日期显示在“到期”列中。此日期是可以将模型用于听录的最后日期。

若要获取基本模型的训练和听录到期日期，请使用 spx csr model status 命令。根据以下说明构造请求参数：

将 url 参数设置为要获取的基本模型的 URI。可以运行 spx csr list --base 命令以获取所有区域设置的可用基本模型。

下面是示例语音 CLI 命令，用于获取基本模型的训练和听录到期日期：

spx csr model status --api-version v3.1 --model https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

在响应中，记下 adaptationDateTime 属性中的日期。此属性是可以使用基本模型进行训练的最后日期。也记下 transcriptionDateTime 属性中的日期。此日期是可以将基本模型用于听录的最后日期。

应收到以下格式的响应正文：

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

对于模型的语音 CLI 帮助，请运行以下命令：

spx help csr model

要获取基本模型的训练和听录到期日期，请使用语音转文本 REST API 的 Models_GetBaseModel 操作。可以发出 Models_ListBaseModels 请求，以获取所有区域设置的可用基本模型。

使用模型 URI 发出 HTTP GET 请求，如以下示例所示。将 BaseModelId 替换为模型 ID，将 YourSubscriptionKey 替换为语音资源密钥，将 YourServiceRegion 替换为语音资源区域。

curl -v -X GET "https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

在响应中，记下 adaptationDateTime 属性中的日期。此日期是可以使用基本模型进行训练的最后日期。也记下 transcriptionDateTime 属性中的日期。此日期是可以将基本模型用于听录的最后日期。

你应该会收到以下格式的响应正文：

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

获取自定义模型到期日期

按照以下说明获取自定义模型的听录到期日期：

登录 Speech Studio。
选择“自定义语音识别”> 你的项目名称 >“训练自定义模型”。
自定义模型的到期日期显示在“到期”列中。此日期是可以将自定义模型用于听录的最后日期。基本模型不会显示在“训练自定义模型”页上。

也可按照以下说明获取自定义模型的听录到期日期：

登录 Speech Studio。
选择“自定义语音识别”> 你的项目名称 >“部署模型”。
模型的到期日期显示在“到期”列中。此日期是可以将模型用于听录的最后日期。

若要获取自定义模型的听录到期日期，请使用 spx csr model status 命令。根据以下说明构造请求参数：

将 url 参数设置为要获取的模型的 URI。将 YourModelId 替换为模型 ID，将 YourServiceRegion 替换为语音资源区域。

下面是示例语音 CLI 命令，用于获取自定义模型的听录到期日期：

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/YourModelId

在响应中，记下 transcriptionDateTime 属性中的日期。此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime 属性不适用，因为自定义模型不可用于训练其他自定义模型。

应收到以下格式的响应正文：

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

对于模型的语音 CLI 帮助，请运行以下命令：

spx help csr model

要获取自定义模型的听录到期日期，请使用语音转文本 REST API 的 Models_GetCustomModel 操作。

使用模型 URI 发出 HTTP GET 请求，如以下示例所示。将 YourModelId 替换为模型 ID，将 YourSubscriptionKey 替换为语音资源密钥，将 YourServiceRegion 替换为语音资源区域。

curl -v -X GET "https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"