什么是语音助手?

通过使用语音服务的语音助理,开发人员为其应用程序和体验创建自然的、类似于人类的对话界面。 语音助理服务在设备和助理实现之间提供快速、可靠的交互。

选择助理解决方案

创建语音助理的第一步是确定希望其执行什么操作。 语音服务为构建助手交互提供多种补充性解决方案。 你可能希望你的应用程序支持开放式对话,例如“我需要去西雅图”或者“我可以点什么样的披萨?”

通过使用语音 SDK 构建语音助手的参考体系结构

Conceptual diagram of the voice assistant orchestration service flow.

核心功能

选择自定义命令创建助理交互时,可以使用丰富的一组自定义功能,根据品牌、产品和个性来自定义助理。

类别 功能
语音转文本 语音助手通过使用语音服务中的语音转文本将实时音频转换为识别的文本。 此文本是听录而成的,因此可供助理实现和客户端应用程序使用。
文本转语音 助手使用语音服务中的文本转语音合成其文本响应。 然后,这些合成内容可作为音频流提供给客户端应用程序使用。 Microsoft 提供构建自己的自定义优质神经文本转语音(神经 TTS)语音的功能,可为你的品牌提供专属语音。

开始使用语音助手

我们提供以下快速入门文章,旨在让你能够在 10 分钟内运行代码:

示例代码和教程

GitHub 上提供了用于创建语音助理的示例代码。 这些示例涵盖使用几种常用编程语言连接到助手的客户端应用程序。

自定义

使用语音服务构建的语音助理可以使用各种自定义选项。

后续步骤