Q: 文本转语音是如何计费的？

文本转语音服务按字符计费。 查看 定价说明 中可计费字符的定义。

Q: 文本转语音合成请求的速率限制是多少？

文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 费率可根据业务理由进行调整，不会因费率上限增加而产生额外的费用。 请在 语音服务配额和限制 中查看更多详细信息。

Q: 如何降低语音应用的延迟？

我们为你提供了一些提示，以降低延迟并为用户提供最佳性能。 请参阅 使用语音 SDK 降低语音合成延迟 。

Q: 文本转语音支持哪些输出音频格式？

Azure AI 文本转语音支持多种流式和非流式音频格式，并且采用常用的采样率。 所有 TTS 标准语音均支持 48 kHz 和 24 kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅 音频输出 。

Q: 是否可以自定义语音以重读特定字词？

某些语音合成可以根据地区设置调整强调。 请参阅 强调标记 。

Q: 我们能否为每一种情感提供多种优势，比如悲伤、轻微悲伤等等？

某些语音支持调整风格程度，具体取决于区域设置。 请参阅 mstts:express-as 标记 。

Q: 视位 ID 和嘴形之间是否有对应关系？

是的。 请参阅 使用视位获取脸部位置 。

Q: 为什么在使用文本转语音标准语音时收到 HTTP 429（请求过多）错误？

文本转语音（TTS）标准语音的默认配额为每秒 200 个事务（TPS），旨在满足大多数客户的需求。 在大多数情况下，HTTP 429 错误不是由配额限制引起的，而是由指定语音所选区域中的后端服务容量不足引起的。 增加配额不会解决这些容量约束。 若要有效解决此问题，请按以下步骤进行： 使用本机区域：在本机支持语音和更好的资源的区域部署语音。 选择常用语音：选择当前区域中更常用的语音，以减少达到容量限制的可能性。

Question 1

文本转语音是如何计费的？

Accepted Answer

文本转语音服务按字符计费。查看定价说明中可计费字符的定义。

Question 2

文本转语音合成请求的速率限制是多少？

Accepted Answer

文本转语音的合成速率在收到更多请求时会自动调整。每个语音资源都设有默认速率限制。费率可根据业务理由进行调整，不会因费率上限增加而产生额外的费用。请在语音服务配额和限制中查看更多详细信息。

Question 3

如何降低语音应用的延迟？

Accepted Answer

我们为你提供了一些提示，以降低延迟并为用户提供最佳性能。请参阅使用语音 SDK 降低语音合成延迟。

Question 4

文本转语音支持哪些输出音频格式？

Accepted Answer

Azure AI 文本转语音支持多种流式和非流式音频格式，并且采用常用的采样率。所有 TTS 标准语音均支持 48 kHz 和 24 kHz 的高保真音频输出。可以根据需要对音频重新采样以支持其他速率。请参阅音频输出。

Question 5

是否可以自定义语音以重读特定字词？

Accepted Answer

某些语音合成可以根据地区设置调整强调。请参阅强调标记。

Question 6

我们能否为每一种情感提供多种优势，比如悲伤、轻微悲伤等等？

Accepted Answer

某些语音支持调整风格程度，具体取决于区域设置。请参阅 mstts:express-as 标记。

Question 7

视位 ID 和嘴形之间是否有对应关系？

Accepted Answer

是的。请参阅使用视位获取脸部位置。

Question 8

为什么在使用文本转语音标准语音时收到 HTTP 429（请求过多）错误？

Accepted Answer

文本转语音（TTS）标准语音的默认配额为每秒 200 个事务（TPS），旨在满足大多数客户的需求。在大多数情况下，HTTP 429 错误不是由配额限制引起的，而是由指定语音所选区域中的后端服务容量不足引起的。增加配额不会解决这些容量约束。若要有效解决此问题，请按以下步骤进行：

使用本机区域：在本机支持语音和更好的资源的区域部署语音。
选择常用语音：选择当前区域中更常用的语音，以减少达到容量限制的可能性。

Question 9

如何在代码中引用在“有声内容创作”平台上创建的词典文件？

Accepted Answer

首先，可以在“有声内容创作”上打开词典文件并获取字典文件 ID，该 ID 显示在文件路径中的“?fileKind=CustomLexiconFile”之前。例如，如果文件路径为 https://speech.azure.cn/portal/d391a094f76846acbcd11dc2ba835f4f/audiocontentcreation/file/6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c?fileKind=CustomLexiconFile，则词典文件 ID 为 6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c。然后，在“有声内容创作”上将引用该词典的文件切换为 SSML 格式。在 SSML 文件中，找到

常规

文本转语音是如何计费的？

文本转语音合成请求的速率限制是多少？

如何降低语音应用的延迟？

文本转语音支持哪些输出音频格式？

是否可以自定义语音以重读特定字词？

我们能否为每一种情感提供多种优势，比如悲伤、轻微悲伤等等？

视位 ID 和嘴形之间是否有对应关系？

为什么在使用文本转语音标准语音时收到 HTTP 429（请求过多）错误？

有声内容创作

如何在代码中引用在“有声内容创作”平台上创建的词典文件？

后续步骤

文本转语音常见问题解答

常规

文本转语音是如何计费的？

文本转语音合成请求的速率限制是多少？

如何降低语音应用的延迟？

文本转语音支持哪些输出音频格式？

是否可以自定义语音以重读特定字词？

我们能否为每一种情感提供多种优势，比如悲伤、轻微悲伤等等？

视位 ID 和嘴形之间是否有对应关系？

为什么在使用文本转语音标准语音时收到 HTTP 429（请求过多）错误？

有声内容创作

如何在代码中引用在“有声内容创作”平台上创建的词典文件？

后续步骤

其他资源