自定义语音识别模型生命周期
将自定义语音识别模型部署到自定义终结点后,可以使用一段时间。 但是当新基本模型可用时,旧模型将过期。 必须基于最新基础模型定期重新创建并训练自定义模型,以利用更高的准确度和质量。
以下是一些与模型生命周期相关的关键术语:
- 训练:采用基础模型,并使用文本数据和/或音频数据根据你的领域/方案对其进行自定义。 在某些上下文(例如 REST API 属性)中,训练也称为适应。
- 听录:使用模型并执行语音识别(将音频解码为文本)。
- 终结点:只有你能够访问的基础模型或自定义模型的特定部署。
注意
F0
语音资源使用的终结点在 7 天后删除。
过期时间线
下面是模型适应和听录的过期时间表:
- 在 Microsoft 创建基础模型的那个季度后的一年内,可进行训练。
- 在 Microsoft 创建基础模型的那个季度后的两年内,可以使用基础模型进行听录。
- 在你创建自定义模型的那个季度后的两年内,可以使用自定义模型进行听录。
在此上下文中,季度的结束日期为 1 月 15 日、4 月 15 日、7 月 15 日和 10 月 15 日。
模型到期时需要执行的操作
自定义模型或基本模型到期时,它不再可用于听录。 可以在不停机的情况下更改自定义语音识别终结点使用的模型。
听录路由 | 已到期模型结果 | 建议 |
---|---|---|
自定义终结点 | 语音识别请求会回退到同一区域设置的最新基本模型。 你会得到结果,但识别可能无法准确听录域数据。 | 更新终结点的模型,如部署自定义语音识别模型指南中所述。 |
批量听录 | 已到期模型的批量听录请求会失败,并出现 4xx 错误。 | 在每个 Transcriptions_Create REST API 请求正文中,将 model 属性设置为一个尚未到期的基本模型或自定义模型。 否则,请不要添加 model 属性,以始终使用最新的基本模型。 |
获取基本模型到期日期
创建自定义模型时会显示可以将基本模型用于训练的最后日期。 有关详细信息,请参阅训练自定义语音识别模型。
按照以下说明获取基本模型的听录到期日期:
登录 Speech Studio。
选择“自定义语音识别”> 你的项目名称 >“部署模型”。
模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。
若要获取基本模型的训练和听录到期日期,请使用 spx csr model status
命令。 根据以下说明构造请求参数:
- 将
url
参数设置为要获取的基本模型的 URI。 可以运行spx csr list --base
命令以获取所有区域设置的可用基本模型。
下面是示例语音 CLI 命令,用于获取基本模型的训练和听录到期日期:
spx csr model status --api-version v3.1 --model https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f
在响应中,记下 adaptationDateTime
属性中的日期。 此属性是可以使用基本模型进行训练的最后日期。 也记下 transcriptionDateTime
属性中的日期。 此日期是可以将基本模型用于听录的最后日期。
应收到以下格式的响应正文:
{
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
"datasets": [],
"links": {
"manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-01-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-06T10:52:02Z",
"status": "Succeeded",
"createdDateTime": "2021-10-13T00:00:00Z",
"locale": "en-US",
"displayName": "20210831 + Audio file adaptation",
"description": "en-US base model"
}
对于模型的语音 CLI 帮助,请运行以下命令:
spx help csr model
要获取基本模型的训练和听录到期日期,请使用语音转文本 REST API 的 Models_GetBaseModel 操作。 可以发出 Models_ListBaseModels 请求,以获取所有区域设置的可用基本模型。
使用模型 URI 发出 HTTP GET 请求,如以下示例所示。 将 BaseModelId
替换为模型 ID,将 YourSubscriptionKey
替换为语音资源密钥,将 YourServiceRegion
替换为语音资源区域。
curl -v -X GET "https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
在响应中,记下 adaptationDateTime
属性中的日期。 此日期是可以使用基本模型进行训练的最后日期。 也记下 transcriptionDateTime
属性中的日期。 此日期是可以将基本模型用于听录的最后日期。
你应该会收到以下格式的响应正文:
{
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
"datasets": [],
"links": {
"manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-01-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-06T10:52:02Z",
"status": "Succeeded",
"createdDateTime": "2021-10-13T00:00:00Z",
"locale": "en-US",
"displayName": "20210831 + Audio file adaptation",
"description": "en-US base model"
}
获取自定义模型到期日期
按照以下说明获取自定义模型的听录到期日期:
登录 Speech Studio。
选择“自定义语音识别”> 你的项目名称 >“训练自定义模型”。
自定义模型的到期日期显示在“到期”列中。 此日期是可以将自定义模型用于听录的最后日期。 基本模型不会显示在“训练自定义模型”页上。
也可按照以下说明获取自定义模型的听录到期日期:
登录 Speech Studio。
选择“自定义语音识别”> 你的项目名称 >“部署模型”。
模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。
若要获取自定义模型的听录到期日期,请使用 spx csr model status
命令。 根据以下说明构造请求参数:
- 将
url
参数设置为要获取的模型的 URI。 将YourModelId
替换为模型 ID,将YourServiceRegion
替换为语音资源区域。
下面是示例语音 CLI 命令,用于获取自定义模型的听录到期日期:
spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/YourModelId
在响应中,记下 transcriptionDateTime
属性中的日期。 此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime
属性不适用,因为自定义模型不可用于训练其他自定义模型。
应收到以下格式的响应正文:
{
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
"baseModel": {
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
},
"datasets": [
{
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
}
],
"links": {
"manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
"copyTo": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
},
"project": {
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-07-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-21T13:21:01Z",
"status": "Succeeded",
"createdDateTime": "2022-05-22T16:37:01Z",
"locale": "en-US",
"displayName": "My Model",
"description": "My Model Description"
}
对于模型的语音 CLI 帮助,请运行以下命令:
spx help csr model
要获取自定义模型的听录到期日期,请使用语音转文本 REST API 的 Models_GetCustomModel 操作。
使用模型 URI 发出 HTTP GET 请求,如以下示例所示。 将 YourModelId
替换为模型 ID,将 YourSubscriptionKey
替换为语音资源密钥,将 YourServiceRegion
替换为语音资源区域。
curl -v -X GET "https://YourServiceRegion.api.cognitive.azure.cn/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
在响应中,记下 transcriptionDateTime
属性中的日期。 此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime
属性不适用,因为自定义模型不可用于训练其他自定义模型。
你应该会收到以下格式的响应正文:
{
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
"baseModel": {
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
},
"datasets": [
{
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
}
],
"links": {
"manifest": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
"copyTo": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
},
"project": {
"self": "https://chinanorth2.api.cognitive.azure.cn/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-07-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-21T13:21:01Z",
"status": "Succeeded",
"createdDateTime": "2022-05-22T16:37:01Z",
"locale": "en-US",
"displayName": "My Model",
"description": "My Model Description"
}