什么是语音 SDK?

语音 SDK(软件开发工具包)公开了许多语音服务功能,这样便可以开发支持语音的应用程序。 语音 SDK 可以在许多编程语言中和所有平台中使用。 语音 SDK 使用本地设备、文件、Azure Blob 存储和输入和输出流,同时适用于实时和非实时方案。

在某些情况下,不能或不应使用语音 SDK。 在这些情况下,可以使用 REST API 访问语音服务。 例如,使用语音转文本 REST API 进行批量听录自定义语音模型管理。

支持的语言

语音 SDK 支持以下语言和平台:

编程语言 参考 平台支持
C# 1 .NET Windows、Linux、macOS、Mono、Xamarin.iOS、Xamarin.Mac、Xamarin.Android、UWP、Unity
C++ 2 C++ Windows、Linux、macOS
Go Go Linux
Java Java Android、Windows、Linux、macOS
JavaScript JavaScript Browser、Node.js
Objective-C Objective-C iOS、macOS
Python Python Windows、Linux、macOS
Swift Objective-C 3 iOS、macOS

1 文档中提供了 C# 代码示例。 C# 语音 SDK 基于 .NET Standard 2.0,因此它支持多种平台和编程语言。 有关详细信息,请参阅 .NET 实现支持
2 C 不是语音 SDK 支持的编程语言。
3 Swift 版语音 SDK 与 Objective-C 版语音 SDK 共享客户端库和参考文档。

重要

下载任何 Azure AI务语音 SDK,即表示你已确认接受其许可条款。 有关详细信息,请参阅:

代码示例

文档和 GitHub 中提供了语音 SDK 代码示例。

Docs 示例

在包含示例的文档页面顶部,可供选择的选项包括 C#、C++、Go、Java、JavaScript、Objective-C、Python 或 Swift。

显示如何在文档中选择编程语言的屏幕截图。

如果你的首选编程语言中没有示例,你可以选择另一种编程语言开始学习并了解这些概念,或者查看文章开头链接的参考和示例。

GitHub 示例

GitHub 上的 Azure-Samples/cognitive-services-speech-sdk 存储库中提供了深入示例。 有 C#(包括 UWP、Unity 和 Xamarin)、C++、Java、JavaScript(包括 Browser 和 Node.js)、Objective-C、Python 和 Swift 的示例。 GitHub 上的 Microsoft/cognitive-services-speech-sdk-go 存储库中提供了 Go 代码示例。

帮助选项

Microsoft Q&AStack Overflow 论坛可供开发人员社区使用,用于提出和回答有关 Azure 认知语音和其他服务的问题。 Microsoft 会监视论坛并回复社区尚未回答的问题。 为确保我们看到你的问题,请将其标记为“azure-speech”。

你可以通过在 GitHub 上创建问题来提出想法或报告错误:

另请参阅 Azure AI 服务支持和帮助选项以获取支持、保持最新状态、提供反馈和报告 Azure AI 服务的 bug。

后续步骤