从被停用的意图识别迁移

Azure 语音中的意向识别已于 2025 年 9 月 30 日停用。 应用程序不能再通过语音使用意向识别。 但是,仍然可以使用 Azure 语言服务执行意向识别。

此更改不会影响其他语音功能,例如 语音转文本 (包括不更改说话人分割)、 文本转语音语音翻译

语音以前在语音 SDK 中公开 IntentRecognizer 对象系列。 这些 API 依赖于语言理解智能服务(LUIS)应用程序或简单的模式匹配构造。 退役后:

  • IntentRecognizer、模式匹配意图/实体和相关参数已不可用。
  • 现有应用程序必须删除直接语音 SDK 意图逻辑,并采用两步方法(语音转文本,然后进行意图分类)或基于单一提示的方法。

选择替代项

Requirement 建议的服务 为什么
使用带标签的训练数据进行结构化意向和实体提取 语言服务对话语言理解 (CLU) 专为多意向分类和实体提取而构建;支持版本、测试和分析。
多语言语音输入流入一致的意向架构 语音识别(STT) + 语义理解(CLU) 语音处理听录;CLU 处理规范化和分类。

迁移步骤

  1. 将任何语音 SDK IntentRecognizer 的用法替换为 SpeechRecognizerConversationTranscriber,以便获取文本。
  2. 对于结构化意向/实体需求,请创建 CLU 项目并部署模型。 将转录的话语发送到 CLU 预测 API。
  3. 从配置中删除对LanguageUnderstandingModel、任何 LUIS 应用程序 ID 和终结点的依赖。
  4. 消除引用 PatternMatchingIntentPatternMatchingEntity 类型的模式匹配代码。
  5. 通过将历史 IntentRecognizer 输出与 CLU 分类结果或 OpenAI 完成进行比较、根据需要调整训练数据或提示来验证准确性。
  6. 更新监视:将任何现有意向延迟/准确性仪表板迁移至新的源(CLU 评估日志或 OpenAI 提示结果跟踪)。

示例体系结构

  1. 语音转文本将音频转录为具有实时或批处理模式的文本。
  2. 响应规范化为常见的 JSON 形状(例如: { "intent": "BookFlight", "entities": { "Destination": "Seattle" } }) 。
  3. 业务逻辑将规范化输出路由到下游服务(预订、知识库、工作流引擎)。

结果格式注意事项

方面 CLU
架构稳定性 高(定义的意向/实体)
版本控制 内置模型版本
培训工作 需要标记的数据集
边缘事例 需要更多标记的数据
延迟 预测 API 调用

常见问题

是否需要重新标记数据? 如果使用 LUIS,则需要将数据导出并重新导入 CLU,然后重新训练。 映射通常是直接的(意图、实体)。 模式匹配的意图可能需要手动转换为示例。

说话人分割是否受到影响? 否。 分割功能继续可用;只需在听录后通过 CLU 或 OpenAI 处理每个演讲者片段即可。