什么是 Azure 语音 CLI？

语音 CLI 是一种命令行工具，用于在不编写代码的情况下使用 Azure 语音。语音 CLI 需要最少的设置，你可以立即开始试验语音服务的关键功能。在几分钟内，运行简单的测试工作流，例如从文件目录进行批量语音识别，或者在文件中的字符串集合上对文本进行语音转语音。除了简单的工作流外，语音 CLI 已经可以用于生产环境。使用自动化 .bat 或 shell 脚本扩展规模，以运行更大的进程。

语音 SDK 中的大多数功能在语音 CLI 中可用，并简化了一些高级功能和自定义。在语音 CLI 和语音 SDK 之间进行选择时，请考虑以下指南。

下列情况下使用语音 CLI：

想在极少设置且无需代码的情况下试验语音服务功能。
对于使用语音服务的生产应用程序，你具有相对简单的要求。

下列情况下使用语音 SDK：

需要在特定语言或平台（如 C#、Python 或 C++）中集成语音服务功能。
你有可能需要高级服务请求的复杂需求。
你要开发自定义行为，包括响应流。

核心功能

语音识别：将语音转换为音频文件中的文本或直接从麦克风转换，或转录录制的对话。
语音合成：将文本文件或命令行中的文字转换为语音。使用语音合成标记语言 (SSML) 配置自定义语音输出特征。
语音翻译：将源语言的音频翻译为目标语言的文本或音频。
Azure 计算：使用 spx webjob发送语音 CLI 命令，以在 Azure 远程计算资源上运行。

开始

若要开始使用语音 CLI，请参阅快速入门。本文介绍如何运行基本命令，并为你提供一些稍微高级一点的命令，用于运行语音转文本和文本转语音的批处理操作。阅读基础知识文章后，你有足够的了解语法来编写自定义命令或自动执行简单的语音服务作。

后续步骤

Last updated on 2026-06-09

什么是 Azure 语音 CLI？

核心功能

开始

后续步骤

Recursos adicionales