如果使用语音转文本并需要开立支持案例,支持人员通常会要求你提供有问题的听录的会话 ID 或听录 ID 来调试问题。 本文将介绍如何获取这些 ID。
实时语音转文本和语音翻译使用语音 SDK 或适用于短音频的 REST API。
若要获取会话 ID,在使用 SDK 时,需要:
- 启用应用程序日志记录。
- 在日志中找到会话 ID。
如果使用适用于 JavaScript 的语音 SDK,请获取会话 ID,如本部分所述。
如果使用语音 CLI,则还能以交互方式获取会话 ID。 请参阅本部分中的详细信息。
对于适用于短音频的语音转文本 REST API,需要在请求中注入会话信息。 请参阅本部分中的详细信息。
如此文中所述为应用程序启用日志记录。
打开应用程序生成的日志文件并查找 SessionId:
。 后面的编号即是所需的会话 ID。 在以下日志摘录示例中,0b734c41faf8430380d493127bd44631
为会话 ID。
[874193]: 218ms SPX_DBG_TRACE_VERBOSE: audio_stream_session.cpp:1238 [0000023981752A40]CSpxAudioStreamSession::FireSessionStartedEvent: Firing SessionStarted event: SessionId: 0b734c41faf8430380d493127bd44631
如果使用适用于 JavaScript 的语音 SDK,则可以利用识别器类中的 sessionStarted
事件获取会话 ID。
请参阅此示例中使用 JavaScript 获取会话 ID 的示例。 查找 recognizer.sessionStarted = onSessionStarted;
,然后查找 function onSessionStarted
。
如果使用语音 CLI,则会在 SESSION STARTED
和 SESSION STOPPED
控制台消息中看到会话 ID。
还可为会话启用日志记录,并如本部分所述从日志文件中获取会话 ID。 运行相应的语音 CLI 命令以获取有关使用日志的信息:
spx help recognize log
spx help translate log
与语音 SDK 不同,适用于短音频的语音转文本 REST API 不会自动生成会话 ID。 你需要自行生成并在 REST 请求中提供该 ID。
在代码中或使用任何标准工具生成 GUID。 使用不带短划线或其他分隔符的 GUID 值。 我们将使用 9f4ffa5113a846eba289aa98b28e766f
作为示例。
使用 X-ConnectionId=<GUID>
表达式作为 REST 请求的一部分。 在本示例中,示例请求如下所示:
https://chinanorth.stt.speech.azure.cn/speech/recognition/conversation/cognitiveservices/v1?language=en-US&X-ConnectionId=9f4ffa5113a846eba289aa98b28e766f
9f4ffa5113a846eba289aa98b28e766f
是会话 ID。
警告
参数 X-ConnectionId
的值应采用不带短划线或其他分隔符的 GUID 格式。 所有其他格式均不受支持,服务将放弃。
示例。 如果请求包含如下所示的表达式:
X-ConnectionId=9f4ffa51-13a8-46eb-a289-aa98b28e766f
(带分隔符的 GUID)X-ConnectionId=Request9f4ffa5113a846eba289aa98b28e766f
(非 GUID)X-ConnectionId=5948f700d2a811ee
(非 GUID)
则系统不接受 X-ConnectionId
的值,并且不会在日志中找到会话。
批量听录 API 是语音转文本 REST API 的子集。
所需的听录 ID 是请求(例如 Transcriptions_Create)返回的响应正文的主 self
元素中包含的 GUID 值。
下面是 Transcriptions_Create 请求的响应正文示例。 第一个 self
元素中的 GUID 值 537216f8-0620-4a10-ae2d-00bdb423b36f
是听录 ID。
{
"self": "https://chinaeast2.api.cognitive.azure.cn/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f",
"model": {
"self": "https://chinaeast2.api.cognitive.azure.cn/speechtotext/v3.1/models/base/824bd685-2d45-424d-bb65-c3fe99e32927"
},
"links": {
"files": "https://chinaeast2.api.cognitive.azure.cn/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f/files"
},
"properties": {
"diarizationEnabled": false,
"wordLevelTimestampsEnabled": false,
"channels": [
0,
1
],
"punctuationMode": "DictatedAndAutomatic",
"profanityFilterMode": "Masked"
},
"lastActionDateTime": "2021-11-19T14:09:51Z",
"status": "NotStarted",
"createdDateTime": "2021-11-19T14:09:51Z",
"locale": "ru-RU",
"displayName": "transcriptiontest"
}
备注
使用相同的方法确定用于调试与自定义语音识别(例如使用 Datasets_Create 请求上传数据集)相关问题的不同 ID。
备注
还可以使用 Transcriptions_Get 请求查看给定语音资源的所有现有听录及其听录 ID。