本文解答有关文本转语音 (TTS) 功能的常见问题。 如果在此处中找不到你的问题的解答,请检查其他支持选项。
文本转语音是如何计费的?
文本转语音服务按字符计费。 查看定价说明中可计费字符的定义。
文本转语音合成请求的速率限制是多少?
文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 费率可根据业务理由进行调整,不会因费率上限增加而产生额外的费用。 请在语音服务配额和限制中查看更多详细信息。
如何降低语音应用的延迟?
我们为你提供了一些提示,以降低延迟并为用户提供最佳性能。 请参阅使用语音 SDK 降低语音合成延迟。
文本转语音支持哪些输出音频格式?
Azure AI 文本转语音支持采用常用采样率的各种流式处理和非流式处理音频格式。 所有 TTS 预生成的神经语音都可支持 48 kHz 和 24 kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅音频输出。
是否可以自定义语音以重读特定字词?
某些语音支持调整强调,具体取决于区域设置。 请参阅强调标记。
每种情绪是否可以有多种不同的强烈程度,比如悲伤、有点悲伤等?
某些语音支持调整风格程度,具体取决于区域设置。 请参阅 mstts:express-as 标记。
视位 ID 和嘴形之间是否有对应关系?
是的。 请参阅使用视位获取面部位置。