什么是语音 SDK?

语音 SDK(软件开发工具包)公开了许多语音服务功能,这样便可以开发支持语音的应用程序。 语音 SDK 可以在许多编程语言中和所有平台中使用。 语音 SDK 非常适合使用本地设备、文件、Azure Blob Storage和输入和输出流实现实时和非实时方案。

在某些情况下,不能或不应使用语音 SDK。 在这些情况下,可以使用 REST API 访问语音服务。 例如,使用语音转文本 REST API 进行批量听录自定义语音模型管理。 对于具有 LLM 语音和快速听录功能的专用听录方案,请使用 语音听录 SDK

支持的语言

语音 SDK 支持以下语言和平台:

编程语言 参考 平台支持
C#1 .NET Windows、Linux、macOS、Mono、UWP
C++2 C++ Windows、Linux、macOS
去吧 去吧 Linux
Java Java Android、Windows、Linux、macOS
JavaScript JavaScript Browser、Node.js
Objective-C Objective-C iOS、macOS
Python Python Windows、Linux、macOS
Swift Objective-C3 iOS、macOS

1 文档中提供了 C# 代码示例。 适用于 C# 的语音 SDK 基于标准 2.0 .NET,因此它支持许多平台和编程语言。 有关详细信息,请参阅 .NET 实现支持
2 C 不是语音 SDK 支持的编程语言。
3 Swift 版语音 SDK 与 Objective-C 版语音 SDK 共享客户端库和参考文档。

重要

通过下载任何Azure语音 SDK,你确认其许可证。 有关详细信息,请参阅:

代码示例

文档和GitHub中提供了语音 SDK 代码示例。

Docs 示例

在包含示例的文档页顶部,选择的选项包括 C#、C++、Go、Java、JavaScript、Objective-C、Python 或 Swift。

显示如何在文档中选择编程语言的屏幕截图。

如果你的首选编程语言中没有示例,你可以选择另一种编程语言开始学习并了解这些概念,或者查看文章开头链接的参考和示例。

GitHub示例

GitHub上的 Azure-Samples/cognitive-services-speech-sdk 存储库中提供了深入示例。 C# (包括 UWP)、C++、Java、JavaScript(包括 Browser 和 Node.js)、Objective-C、Python 和 Swift 都有示例。 go 代码示例在 GitHub 上的 Microsoft/cognitive-services-speech-sdk-go 存储库中提供。

帮助选项

Stack Overflow 论坛可供开发人员社区提出和回答有关 Azure 语音和其他服务的问题。 Microsoft 会监视论坛并回复社区尚未回答的问题。 为确保我们看到你的问题,请将其标记为“azure-speech”。

可以通过在 GitHub 上创建议题来提出想法或报告bug。

另请参阅 Azure AI services 支持和帮助选项,以获取支持、提供反馈、报告 Azure AI services 错误,并保持最新。

后续步骤