什么是语音听录 SDK?

语音听录软件开发工具包(SDK)公开语音服务的 LLM 语音和快速听录功能,以便更轻松地开发高质量的听录应用程序。 语音听录 SDK 可在许多编程语言 和跨平台中使用。 语音听录 SDK 非常适合使用本地设备捕获的音频、文件和Azure Blob Storage数据,实现近实时和非实时方案。

在某些情况下,不能或不应该使用 语音听录 SDK。 在这些情况下,可以使用 WebSocket 或 REST API 实时流式处理来访问语音服务。 例如,使用语音 SDK 进行实时流式处理,或使用语音转文本 REST API 进行大容量处理和自定义语音模型管理的批量听录

支持的语言

语音听录 SDK 支持以下语言和平台:

程序设计语言 Reference 平台支持
Java Java Android、Windows、Linux、macOS
Python Python Windows、Linux、macOS

代码示例

文档和GitHub中提供了语音听录 SDK 代码示例。

Docs 示例

程序设计语言 快速入门文档
Java 快速听录
Python 快速听录

如果你的首选编程语言中没有示例,你可以选择另一种编程语言开始学习并了解这些概念,或者查看文章开头链接的参考和示例。

GitHub示例

可以在各自的GitHub存储库中找到每个编程语言的示例。

程序设计语言 示例存储库
Java Java 示例
Python Python 示例

帮助选项

开发人员社区可以使用 Stack Overflow 论坛来提问和回答有关Azure认知语音和其他服务的问题。 Microsoft监视论坛,并回答社区尚未回答的问题。 若要确保Microsoft看到你的问题,请使用“azure-speech”对其进行标记。

可以通过在 GitHub 上创建议题来报告 bug 或提出建议。

另请参阅 Foundry 工具支持和帮助选项,以获取支持、保持最新、提供反馈并报告 Foundry 工具中的错误。

后续步骤