本文包含有关 Azure 语音配额和限制的快速参考和详细说明。 此信息适用于 Azure 语音的所有 定价层 。 本文还包含一些避免请求频率限制的最佳实践。
有关免费(F0)定价层,请参阅 定价页上的每月津贴。
配额和限制参考
以下部分提供了适用于 Azure 语音的配额和限制的快速指南。
有关标准 (S0) Azure 语音资源的可调整配额的信息,请参阅本文后面的 更多说明、 最佳做法和 调整说明 。 免费 (F0) Azure 语音资源的配额和限制不可调整。
重要
如果将 Azure 语音的 AI Services 资源从“免费”(F0)定价层切换到“标准”(S0),则相应配额的更改可能需要几个小时。
每个资源的语音转文本配额和限制
以下部分介绍每个 Azure 语音资源的语音转文本配额和限制。 有关可调整配额的信息,请参阅本文中的 更多说明 。
实时语音转文本和语音翻译
可以将实时语音转文本与 语音 SDK 或 语音转文本 REST API 配合使用,用于短音频。
这些限制适用于并发的实时语音转文本请求和语音翻译请求合并后的情况。 例如,如果有 60 个并发语音转文本请求和 40 个并发语音翻译请求,则达到 100 个并发请求的限制。
| 配额 | 免费 (F0) | 标准 (S0) |
|---|---|---|
| 基本模型终结点的并发请求限制 | 1 此限制不可调整。 |
100(默认值) 对于标准 (S0) 资源,费率是可调整的。 请参阅本文后面的 更多说明、 最佳做法和 调整说明 。 |
| 自定义终结点的并发请求限制 | 1 此限制不可调整。 |
100(默认值) 对于标准 (S0) 资源,费率是可调整的。 请参阅本文后面的 更多说明、 最佳做法和 调整说明 。 |
| 实时分割的最大音频长度 | 不適用 | 每个文件 240 分钟 |
快速转录
| 配额 | 免费 (F0) | 标准 (S0) |
|---|---|---|
| 最大音频输入文件大小 | 不適用 | < 300 MB |
| 最大音频长度 | 不適用 | < 每个文件 120 分钟 |
| 每分钟最大请求数 | 不適用 | 600 |
批量听录
| 配额 | 免费 (F0) | 标准 (S0) |
|---|---|---|
| 语音转文本 REST API 限制 | 不可用于 F0 | 每 10 秒 100 个请求(每分钟 600 个请求) |
| 音频输入的最大文件大小 | 不適用 | 1GB |
| 每个容器的最大 blob 个数 | 不適用 | 10,000 |
| 每个听录请求的最大文件数(使用多个内容 URL 作为输入时) | 不適用 | 1,000 |
| 启用了分割的听录的最大音频长度 | 不適用 | 每个文件 240 分钟 |
模型自定义
创建自定义语音模型时,此表中的限制适用于每个 Azure 语音资源。
每个资源的文本转语音配额和限制
以下部分介绍每个 Azure 语音资源的文本转语音配额和限制。 有关可调整配额的信息,请参阅本文后面的 更多说明 。
实时文本转语音
您可以使用 语音 SDK 或 文本转语音 REST API 实现实时文本转语音。 除非另有说明,否则限制不可调整。
| 配额 | 免费 (F0) | 标准 (S0) |
|---|---|---|
| 标准语音每个指定时间段的最大事务量 | 每 60 秒 20 笔交易 此限制不可调整。 |
每秒 200 个事务 (TPS)(默认值) 标准 (S0) 资源的速率可调整到 1,000 TPS。 请参阅本文后面的 更多说明、 最佳做法和 调整说明 。 |
| 每个请求生成的最大音频长度 | 10 分钟 | 10 分钟 |
SSML 中不同 <voice> 和 <audio> 标记的最大总数 |
50 | 50 |
| WebSocket 每个轮次的最大 SSML 消息大小 | 64 KB | 64 KB |
备注
大多数 HTTP 429 错误与文本转语音标准语音都是由所选区域中特定语音的后端服务容量受限引起的,而不是配额限制造成的。 增加配额无法解决这些错误。 为获得最佳效果,请使用其本机区域中的声音,或在当前区域中选择更流行的声音。
有声内容创作工具
| 配额 | 免费 (F0) | 标准 (S0) |
|---|---|---|
| 文件大小(SSML 的纯文本)1 | 每个文件 3,000 个字符 | 每个文件 20,000 个字符 |
| 文件大小(词典文件)2 | 每个文件 30 KB | 每个文件 100 KB |
| SSML 中的可计费字符 | 每个文件 15,000 个字符 | 每个文件 100,000 个字符 |
| 导出到音频库 | 1 个并发任务 | 不適用 |
1 限制仅适用于 SSML 中的纯文本,不包括标记。
2 词典文件中的字符不产生费用。 只有 SSML 的词典元素才会计为可计费字符。 若要了解详细信息,请参阅 计费字符。
详细说明、配额调整和最佳做法
某些 Azure 语音配额是可调整的。 本部分提供了其他说明、最佳做法和调整说明。
对于标准 (S0) 资源,以下配额可调整。 免费 (F0) 请求限制不可调整。
在请求增加配额之前(如果适用),请检查当前每秒事务数(TPS)或每分钟令牌数(TPM),并确保确实需要增加配额。
备注
批量听录和批处理合成是异步过程。 它们在队列中逐个处理任务。 因此,增加配额不会提高听录性能。 有关性能改进,请参阅 改进性能的最佳做法。
Azure 语音使用自动缩放技术将所需的计算资源引入按需模式。 同时,Azure 语音会尝试通过不保持过多的硬件容量来降低成本。
我们来看一个示例。 假设你的应用程序收到响应代码 429,则表示请求过多。 即使工作负荷位于前面 “配额和限制” 部分定义的限制范围内,应用程序也会收到此响应。 最有可能的解释是,Azure 语音正在纵向扩展以满足需求,但尚未达到所需的规模。 因此,Azure 语音没有足够资源来提供请求。 在这种情况下,增加配额无济于事。 在大多数情况下,Azure 语音将很快纵向扩展并解决导致响应代码 429 的问题。
最佳做法是,每个实现都应正常处理 429 个错误,并采用重试逻辑来确保最佳性能并处理自动缩放。 请考虑在请求其他配额之前实施此最佳做法,如下一部分所述。
在自动缩放期间缓解限制的常规最佳做法
若要尽量减少与限制相关的问题,可使用以下方法:
在应用程序中实现重试逻辑以处理 429 错误。
避免工作负载的急剧变化。 逐步增大工作负载。
例如,假设应用程序使用文本转语音,且当前工作负载为 5 TPS。 接下来,你将负载增加到 20 TPS(即原来的四倍)。 Azure 语音会立即开始扩展以满足新负载,但在一秒内无法按需扩展。 某些请求收到响应代码 429(请求太多)。
测试负载增加的不同模式。 有关详细信息,请参阅本文中的 工作负荷模式示例 。
在不同区域中创建更多 Azure 语音资源,并在其中分配工作负荷。 在同一区域中创建多个 Azure 语音资源不会影响性能,因为同一后端群集为所有资源提供服务。
后面的部分介绍调整配额的特定情况。
工作负荷模式的最佳做法示例
下面是一个可采用的好方法的常规示例。 它仅作为一个模板,你可以根据需要进行调整,以供你自己使用。
假设 Azure 语音资源将并发请求限制设置为 300。 从 20 个并发连接启动工作负载,并在每 90 到 120 秒增加 20 个并发连接。 控制 Azure 语音响应,并在收到过多请求(响应代码 429)时实现回退(减少负载)的逻辑。 然后,在一分钟内重试负载增加。 如果仍然不起作用,请在两分钟内重试。 对于间隔使用1-2-4-4 分钟模式。
通常,最好在进入生产环境之前测试工作负荷和工作负荷模式。
语音直播:提高实时语音转文本并发请求限制
准备所需信息
有关如何获取所需常规资源信息的说明,请参阅本文后面的 “创建和提交配额增加请求 ”。
备注
每分钟令牌数 (TPM) 限制取决于每分钟新连接数 (NCPM) 限制。 当 NCPM 限制增加时,它会自动增加。
公式为:TPM = NCPM * 4,000 个词元。 例如:30 NCPM * 4000 个令牌 = 120000 TPM。
创建配额增加请求
若要使用收集的信息创建请求,请按照本文后面的 “创建”步骤并提交配额增加请求 。
语音转文本:增加实时语音转文本并发请求限制
默认情况下,合并的并发实时语音转文本和语音翻译 请求 数限制为:
- 基础模型中每个资源 100 个。
- 在自定义模型中,每个自定义终结点限100个。
对于标准定价层,可以增加此金额。 在提交请求之前,请确保您已熟悉本文前面讨论的材料,例如缓解限流的最佳实践。
基础模型和自定义模型的并发请求限制需要单独调整。 Azure 语音资源可以与托管许多自定义模型部署的多个自定义终结点相关联。 必须单独请求每个自定义终结点的任何限制调整。
提高并发请求的限制不会直接影响成本。 Azure 语音使用支付模型,该模型要求你仅为使用的内容付费。 此限制定义了 Azure 语音在开始限制请求之前可以扩展的程度。
在 Azure 门户、命令行工具或 API 请求中看不到并发请求限制的参数的现有值。 若要验证现有值,请创建 Azure 支持请求。
准备所需信息
有关如何获取所需常规资源信息的说明,请参阅本文后面的 “创建和提交配额增加请求 ”。
若要为自定义语音创建增加请求,还需要提供 自定义终结点 ID。 若要获取自定义语音终结点的信息,请执行以下步骤:
- 转到 Speech Studio 门户。
- 如有必要,请登录,然后转到 自定义语音。
- 选择项目,然后转到 “部署”。
- 选择所需终结点。
- 复制并保存 终结点 ID 值。
创建配额增加请求
若要使用收集的信息创建请求,请按照本文后面的 “创建”步骤并提交配额增加请求 。
快速转录:增加每分钟的最大请求数量
准备所需信息
有关如何获取所需常规资源信息的说明,请参阅本文后面的 “创建和提交配额增加请求 ”。
若要为快速听录创建增加请求,还需要 为每个 API 请求提供平均音频长度。
示例长度为 5 minutes/request. 根据要处理的工作负荷提供估计值。
创建配额增加请求
若要使用收集的信息创建请求,请按照本文后面的 “创建”步骤并提交配额增加请求 。
文本转语音:增加实时 TPS 限制
对于标准定价层,可以增加实时 TPS 限制。 在提交请求之前,请确保您已熟悉本文前面讨论的材料,例如缓解限流的最佳实践。
估算需求
- 使用量低于 10,000 英镑/月:通常,32 TPS 足够,假设峰值使用量在平均值的 10 倍以内。
- 默认限制:默认提供 200 TPS。 此限制超过大多数用例。
示例方案
例如,假设你正在构建一个呼叫中心,其中:
- 并发调用数为 1,000。
- 你期望客服人员说话时间占一半。
- 平均 TTS 响应长度为 5 秒。
所需的 TPS 为:1,000 个调用/(2×5 秒) = 100 TPS。
TPS增加请求需要提供以下详细信息:
- 峰值 TPS
- 平均 TPS
- 平均 TTS 请求长度(以字符为单位)
使用此数据,可以使用此公式估算每月 TTS 使用情况:每月使用情况 = 平均 TPS × 请求长度× 3600 × 24 × 30。
将结果乘以每百万个字符 15 元的单价来估算每月成本。
备注
如果估计的使用量显著超过预算,则可能会过度估计需求。
成本注意事项
增加并发请求限制 不会直接影响 成本。 您只需为您的使用情况付费。 限制只是定义在限制开始之前可以缩放的 Azure 语音数量。
在 Azure 门户、命令行工具或 API 请求中看不到并发请求限制的参数的现有值。 若要验证现有值,请创建 Azure 支持请求。
准备所需信息
有关如何获取所需常规资源信息的说明,请参阅本文后面的 “创建和提交配额增加请求 ”。
若要为标准语音创建增加请求,还需要提供 请求增加的语音名称。 可以在 Azure 语音的语言和语音支持中找到所有语音名称的列表。
创建配额增加请求
若要使用收集的信息创建请求,请按照本文后面的 “创建”步骤并提交配额增加请求 。
创建和提交配额增加请求
若要获取增加配额请求所需的资源信息,请执行以下步骤:
转到 Azure 门户。
选择要增加并发请求限制的资源。
在 “资源管理 ”组中,选择“ 属性”。
复制并保存以下字段的值:
- 订阅 ID
- 资源 ID
- 位置(终结点区域)