语音服务提供了一个 Swagger 规范,用于与少量 REST API 交互,这些 REST API 用于导入数据、创建模型、测试模型准确性、创建自定义终结点、排列批量听录以及管理订阅。 可使用这些 API 以编程方式完成通过 Speech Studio 自定义语音识别区域提供的大部分操作。
注意
语音服务具有多个 REST API,分别用于语音转文本和文本转语音。
但是,Swagger 规范中仅记录了语音转文本 REST API。 有关所有其他语音服务 REST API 的信息,请参阅上一段中引用的文档。
从 Swagger 规范生成代码
Swagger 规范包含可快速测试各种路径的选项。 但有时需要为所有路径生成代码,从而创建可基于未来的解决方案的单个调用库。 我们来看一看为语音转文本 REST API 版本 3.1 生成 Python 库的过程。
你需要将 Swagger 设置为你的语音资源的区域。 可在 Azure 门户中的语音资源设置的“概述”部分确认该区域。 此处提供受支持区域的完整列表。
- 在浏览器中,转到 https://editor.swagger.io
- 依次选择“文件”和“导入 URL”,
- 输入 URL
https://github.com/Azure/azure-rest-api-specs/blob/master/specification/cognitiveservices/data-plane/Speech/SpeechToText/stable/v3.1/speechtotext.json
,然后选择“确定”。 - 选择“生成客户端”,然后选择“Python”。 客户端库会以
.zip
文件格式下载到你的计算机中。 - 提取下载的全部内容。 可使用
tar -xf
提取全部内容。 - 将提取的模块安装到 Python 环境:
pip install path/to/package/python-client
- 将安装的包命名为
swagger_client
。 检查安装是否成功:
python -c "import swagger_client"
可以使用通过 GitHub 上的语音服务示例生成的 Python 库。