如何获取语音转文本会话 ID 和听录 ID

如果使用语音转文本并需要开立支持案例,支持人员通常会要求你提供有问题的听录的会话 ID 或听录 ID 来调试问题。 本文将介绍如何获取这些 ID。

备注

获取会话 ID

实时语音转文本语音翻译使用语音 SDK适用于短音频的 REST API

若要获取会话 ID,在使用 SDK 时,需要:

  1. 启用应用程序日志记录。
  2. 在日志中找到会话 ID。

如果使用适用于 JavaScript 的语音 SDK,请获取会话 ID,如本部分所述。

如果使用语音 CLI,则还能以交互方式获取会话 ID。 请参阅本部分中的详细信息。

对于适用于短音频的语音转文本 REST API,需要在请求中注入会话信息。 请参阅本部分中的详细信息。

在语音 SDK 中启用日志记录

此文中所述为应用程序启用日志记录。

从日志中获取会话 ID

打开应用程序生成的日志文件并查找 SessionId:。 后面的编号即是所需的会话 ID。 在以下日志摘录示例中,0b734c41faf8430380d493127bd44631 为会话 ID。

[874193]: 218ms SPX_DBG_TRACE_VERBOSE:  audio_stream_session.cpp:1238 [0000023981752A40]CSpxAudioStreamSession::FireSessionStartedEvent: Firing SessionStarted event: SessionId: 0b734c41faf8430380d493127bd44631

使用 JavaScript 获取会话 ID

如果使用适用于 JavaScript 的语音 SDK,则可以利用识别器类中的 sessionStarted 事件获取会话 ID。

请参阅此示例中使用 JavaScript 获取会话 ID 的示例。 查找 recognizer.sessionStarted = onSessionStarted;,然后查找 function onSessionStarted

使用语音 CLI 获取会话 ID

如果使用语音 CLI,则会在 SESSION STARTEDSESSION STOPPED 控制台消息中看到会话 ID。

还可为会话启用日志记录,并如本部分所述从日志文件中获取会话 ID。 运行相应的语音 CLI 命令以获取有关使用日志的信息:

spx help recognize log
spx help translate log

使用适用于短音频的 REST API 提供会话 ID

与语音 SDK 不同,适用于短音频的语音转文本 REST API 不会自动生成会话 ID。 你需要自行生成并在 REST 请求中提供该 ID。

在代码中或使用任何标准工具生成 GUID。 使用不带短划线或其他分隔符的 GUID 值。 我们将使用 9f4ffa5113a846eba289aa98b28e766f 作为示例。

使用 X-ConnectionId=<GUID> 表达式作为 REST 请求的一部分。 在本示例中,示例请求如下所示:

https://chinanorth.stt.speech.azure.cn/speech/recognition/conversation/cognitiveservices/v1?language=en-US&X-ConnectionId=9f4ffa5113a846eba289aa98b28e766f

9f4ffa5113a846eba289aa98b28e766f 是会话 ID。

警告

参数 X-ConnectionId 的值应采用不带短划线或其他分隔符的 GUID 格式。 所有其他格式均不受支持,服务将放弃。

示例。 如果请求包含如下所示的表达式:

  • X-ConnectionId=9f4ffa51-13a8-46eb-a289-aa98b28e766f(带分隔符的 GUID)
  • X-ConnectionId=Request9f4ffa5113a846eba289aa98b28e766f(非 GUID)
  • X-ConnectionId=5948f700d2a811ee(非 GUID)

则系统不接受 X-ConnectionId 的值,并且不会在日志中找到会话。

获取批量听录的听录 ID

批量听录 API语音转文本 REST API 的子集。

所需的听录 ID 是请求(例如 Transcriptions_Create)返回的响应正文的主 self 元素中包含的 GUID 值。

下面是 Transcriptions_Create 请求的响应正文示例。 第一个 self 元素中的 GUID 值 537216f8-0620-4a10-ae2d-00bdb423b36f 是听录 ID。

{
  "self": "https://chinaeast2.api.cognitive.azure.cn/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f",
  "model": {
    "self": "https://chinaeast2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/824bd685-2d45-424d-bb65-c3fe99e32927"
  },
  "links": {
    "files": "https://chinaeast2.api.cognitive.azure.cn/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked"
  },
  "lastActionDateTime": "2021-11-19T14:09:51Z",
  "status": "NotStarted",
  "createdDateTime": "2021-11-19T14:09:51Z",
  "locale": "ru-RU",
  "displayName": "transcriptiontest"
}

备注

使用相同的方法确定用于调试与自定义语音识别(例如使用 Datasets_Create 请求上传数据集)相关问题的不同 ID。

备注

还可以使用 Transcriptions_Get 请求查看给定语音资源的所有现有听录及其听录 ID。