语音听录软件开发工具包(SDK)公开语音服务的 LLM 语音和快速听录功能,以便更轻松地开发高质量的听录应用程序。 语音听录 SDK 可在许多编程语言 和跨平台中使用。 语音听录 SDK 非常适合使用本地设备捕获的音频、文件和Azure Blob Storage数据,实现近实时和非实时方案。
在某些情况下,不能或不应该使用 语音听录 SDK。 在这些情况下,可以使用 WebSocket 或 REST API 实时流式处理来访问语音服务。 例如,使用语音 SDK 进行实时流式处理,或使用语音转文本 REST API 进行大容量处理和自定义语音模型管理的批量听录。
支持的语言
语音听录 SDK 支持以下语言和平台:
| 程序设计语言 | Reference | 平台支持 |
|---|---|---|
| Java | Java | Android、Windows、Linux、macOS |
| Python | Python | Windows、Linux、macOS |
代码示例
文档和GitHub中提供了语音听录 SDK 代码示例。
Docs 示例
| 程序设计语言 | 快速入门文档 |
|---|---|
| Java | 快速听录 |
| Python | 快速听录 |
如果你的首选编程语言中没有示例,你可以选择另一种编程语言开始学习并了解这些概念,或者查看文章开头链接的参考和示例。
GitHub示例
可以在各自的GitHub存储库中找到每个编程语言的示例。
| 程序设计语言 | 示例存储库 |
|---|---|
| Java | Java 示例 |
| Python | Python 示例 |
帮助选项
开发人员社区可以使用 Stack Overflow 论坛来提问和回答有关Azure认知语音和其他服务的问题。 Microsoft监视论坛,并回答社区尚未回答的问题。 若要确保Microsoft看到你的问题,请使用“azure-speech”对其进行标记。
可以通过在 GitHub 上创建议题来报告 bug 或提出建议。
另请参阅 Foundry 工具支持和帮助选项,以获取支持、保持最新、提供反馈并报告 Foundry 工具中的错误。
后续步骤
- 了解语音 SDK ,以获得更广泛的语音功能