为语音转文本 REST API 生成 REST API 客户端库

语音服务提供了一个 Swagger 规范,用于与少量 REST API 交互,这些 REST API 用于导入数据、创建模型、测试模型准确性、创建自定义终结点、排列批量听录以及管理订阅。 可使用这些 API 以编程方式完成通过 Speech Studio 自定义语音识别区域提供的大部分操作。

注意

语音服务具有多个 REST API,分别用于语音转文本文本转语音

但是,Swagger 规范中仅记录了语音转文本 REST API。 有关所有其他语音服务 REST API 的信息,请参阅上一段中引用的文档。

从 Swagger 规范生成代码

Swagger 规范包含可快速测试各种路径的选项。 但有时需要为所有路径生成代码,从而创建可基于未来的解决方案的单个调用库。 我们来看一看为语音转文本 REST API 版本 3.1 生成 Python 库的过程。

你需要将 Swagger 设置为你的语音资源的区域。 可在 Azure 门户中的语音资源设置的“概述”部分确认该区域。 此处提供受支持区域的完整列表。

  1. 在浏览器中,转到 https://editor.swagger.io
  2. 依次选择“文件”和“导入 URL”,
  3. 输入 URL https://github.com/Azure/azure-rest-api-specs/blob/master/specification/cognitiveservices/data-plane/Speech/SpeechToText/stable/v3.1/speechtotext.json,然后选择“确定”
  4. 选择“生成客户端”,然后选择“Python”。 客户端库会以 .zip 文件格式下载到你的计算机中。
  5. 提取下载的全部内容。 可使用 tar -xf 提取全部内容。
  6. 将提取的模块安装到 Python 环境:
    pip install path/to/package/python-client
  7. 将安装的包命名为 swagger_client。 检查安装是否成功:
    python -c "import swagger_client"

可以使用通过 GitHub 上的语音服务示例生成的 Python 库。

后续步骤