自定义语音识别模型生命周期

将自定义语音识别模型部署到自定义终结点后,可以使用一段时间。 但是当新基本模型可用时,旧模型将过期。 必须基于最新基础模型定期重新创建并训练自定义模型,以利用更高的准确度和质量。

以下是一些与模型生命周期相关的关键术语:

  • 训练:采用基础模型,并使用文本数据和/或音频数据根据你的领域/方案对其进行自定义。 在某些上下文(例如 REST API 属性)中,训练也称为适应。
  • 听录:使用模型并执行语音识别(将音频解码为文本)。
  • 终结点:只有你能够访问的基础模型或自定义模型的特定部署。

注意

F0 语音资源使用的终结点在 7 天后删除。

过期时间线

下面是模型适应和听录的过期时间表:

  • 在 Microsoft 创建基础模型的那个季度后的一年内,可进行训练。
  • 在 Microsoft 创建基础模型的那个季度后的两年内,可以使用基础模型进行听录。
  • 在你创建自定义模型的那个季度后的两年内,可以使用自定义模型进行听录。

在此上下文中,季度的结束日期为 1 月 15 日、4 月 15 日、7 月 15 日和 10 月 15 日。

模型到期时需要执行的操作

自定义模型或基本模型到期时,它不再可用于听录。 可以在不停机的情况下更改自定义语音识别终结点使用的模型。

听录路由 已到期模型结果 建议
自定义终结点 语音识别请求会回退到同一区域设置的最新基本模型。 你会得到结果,但识别可能无法准确听录域数据。 更新终结点的模型,如部署自定义语音识别模型指南中所述。
批量听录 已到期模型的批量听录请求会失败,并出现 4xx 错误。 在每个 Transcriptions_Create REST API 请求正文中,将 model 属性设置为一个尚未到期的基本模型或自定义模型。 否则,请不要添加 model 属性,以始终使用最新的基本模型。

获取基本模型到期日期

创建自定义模型时会显示可以将基本模型用于训练的最后日期。 有关详细信息,请参阅训练自定义语音识别模型

按照以下说明获取基本模型的听录到期日期:

  1. 登录 Speech Studio

  2. 选择“自定义语音识别”> 你的项目名称 >“部署模型”。

  3. 模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。

    显示听录到期日期的“部署模型”页的屏幕截图。

若要获取基本模型的训练和听录到期日期,请使用 spx csr model status 命令。 根据以下说明构造请求参数:

  • url 参数设置为要获取的基本模型的 URI。 可以运行 spx csr list --base 命令以获取所有区域设置的可用基本模型。

下面是示例语音 CLI 命令,用于获取基本模型的训练和听录到期日期:

spx csr model status --api-version v3.1 --model https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

在响应中,记下 adaptationDateTime 属性中的日期。 此属性是可以使用基本模型进行训练的最后日期。 也记下 transcriptionDateTime 属性中的日期。 此日期是可以将基本模型用于听录的最后日期。

应收到以下格式的响应正文:

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

对于模型的语音 CLI 帮助,请运行以下命令:

spx help csr model

要获取基本模型的训练和听录到期日期,请使用语音转文本 REST APIModels_GetBaseModel 操作。 可以发出 Models_ListBaseModels 请求,以获取所有区域设置的可用基本模型。

使用模型 URI 发出 HTTP GET 请求,如以下示例所示。 将 BaseModelId 替换为模型 ID,将 YourSubscriptionKey 替换为语音资源密钥,将 YourServiceRegion 替换为语音资源区域。

curl -v -X GET "https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

在响应中,记下 adaptationDateTime 属性中的日期。 此日期是可以使用基本模型进行训练的最后日期。 也记下 transcriptionDateTime 属性中的日期。 此日期是可以将基本模型用于听录的最后日期。

你应该会收到以下格式的响应正文:

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

获取自定义模型到期日期

按照以下说明获取自定义模型的听录到期日期:

  1. 登录 Speech Studio

  2. 选择“自定义语音识别”> 你的项目名称 >“训练自定义模型”。

  3. 自定义模型的到期日期显示在“到期”列中。 此日期是可以将自定义模型用于听录的最后日期。 基本模型不会显示在“训练自定义模型”页上。

    显示听录到期日期的“训练自定义模型”页的屏幕截图。

也可按照以下说明获取自定义模型的听录到期日期:

  1. 登录 Speech Studio

  2. 选择“自定义语音识别”> 你的项目名称 >“部署模型”。

  3. 模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。

    显示听录到期日期的“部署模型”页的屏幕截图。

若要获取自定义模型的听录到期日期,请使用 spx csr model status 命令。 根据以下说明构造请求参数:

  • url 参数设置为要获取的模型的 URI。 将 YourModelId 替换为模型 ID,将 YourServiceRegion 替换为语音资源区域。

下面是示例语音 CLI 命令,用于获取自定义模型的听录到期日期:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/YourModelId

在响应中,记下 transcriptionDateTime 属性中的日期。 此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime 属性不适用,因为自定义模型不可用于训练其他自定义模型。

应收到以下格式的响应正文:

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

对于模型的语音 CLI 帮助,请运行以下命令:

spx help csr model

要获取自定义模型的听录到期日期,请使用语音转文本 REST APIModels_GetCustomModel 操作。

使用模型 URI 发出 HTTP GET 请求,如以下示例所示。 将 YourModelId 替换为模型 ID,将 YourSubscriptionKey 替换为语音资源密钥,将 YourServiceRegion 替换为语音资源区域。

curl -v -X GET "https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

在响应中,记下 transcriptionDateTime 属性中的日期。 此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime 属性不适用,因为自定义模型不可用于训练其他自定义模型。

你应该会收到以下格式的响应正文:

{
  "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}