文本转语音常见问题解答

本文解答有关文本转语音 (TTS) 功能的常见问题。 如果在此处中找不到你的问题的解答,请检查其他支持选项

常规

文本转语音是如何计费的?

文本转语音服务按字符计费。 查看定价说明中可计费字符的定义。

文本转语音合成请求的速率限制是多少?

文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 费率可根据业务理由进行调整,不会因费率上限增加而产生额外的费用。 请在语音服务配额和限制中查看更多详细信息。

如何降低语音应用的延迟?

我们为你提供了一些提示,以降低延迟并为用户提供最佳性能。 请参阅使用语音 SDK 降低语音合成延迟

文本转语音支持哪些输出音频格式?

Azure AI 文本转语音支持多种流式和非流式音频格式,并且采用常用的采样率。 所有 TTS 标准语音均支持 48 kHz 和 24 kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅音频输出

是否可以自定义语音以重读特定字词?

某些语音合成可以根据地区设置调整强调。 请参阅强调标记

我们能否为每一种情感提供多种优势,比如悲伤、轻微悲伤等等?

某些语音支持调整风格程度,具体取决于区域设置。 请参阅 mstts:express-as 标记

视位 ID 和嘴形之间是否有对应关系?

是的。 请参阅使用视位获取脸部位置

为什么在使用文本转语音标准语音时收到 HTTP 429(请求过多)错误?

文本转语音(TTS)标准语音的默认配额为每秒 200 个事务(TPS),旨在满足大多数客户的需求。 在大多数情况下,HTTP 429 错误不是由配额限制引起的,而是由指定语音所选区域中的后端服务容量不足引起的。 增加配额不会解决这些容量约束。 若要有效解决此问题,请按以下步骤进行:

  • 使用本机区域:在本机支持语音和更好的资源的区域部署语音。
  • 选择常用语音:选择当前区域中更常用的语音,以减少达到容量限制的可能性。

有声内容创作

如何在代码中引用在“有声内容创作”平台上创建的词典文件?

首先,可以在“有声内容创作”上打开词典文件并获取字典文件 ID,该 ID 显示在文件路径中的“?fileKind=CustomLexiconFile”之前。 例如,如果文件路径为 https://speech.azure.cn/portal/d391a094f76846acbcd11dc2ba835f4f/audiocontentcreation/file/6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c?fileKind=CustomLexiconFile,则词典文件 ID 为 6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c。 然后,在“有声内容创作”上将引用该词典的文件切换为 SSML 格式。 在 SSML 文件中,找到 <!--ID=FCB xml 节点,在其中可根据所述文件 ID 找到词典文件的 URI。 最后,使用代码中的 SSML 词典元素引用词典文件 URI 链接。 例如,如果找到 XML 节点 <!--ID=FCB5B6FB566-33CA-4B68-BEAF-B013C53B3368;Version=1|{"Files":{"6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c":{"FileKind":"CustomLexiconFile","FileSubKind":"CustomLexiconFile","Uri":"https://cvoiceprodwus2.blob.core.chinacloudapi.cn/acc-public-files/d391a094f76846acbcd11dc2ba835f4f/e9a6a5a2-9cef-47f4-b961-d175be75d92f.xml"}}},则可以获取词典文件 URI https://cvoiceprodwus2.blob.core.chinacloudapi.cn/acc-public-files/d391a094f76846acbcd11dc2ba835f4f/e9a6a5a2-9cef-47f4-b961-d175be75d92f.xml