Azure 语音中的意向识别已于 2025 年 9 月 30 日停用。 应用程序不能再通过语音使用意向识别。 但是,仍然可以使用 Azure 语言服务执行意向识别。
此更改不会影响其他语音功能,例如 语音转文本 (包括不更改说话人分割)、 文本转语音和 语音翻译。
语音以前在语音 SDK 中公开 IntentRecognizer 对象系列。 这些 API 依赖于语言理解智能服务(LUIS)应用程序或简单的模式匹配构造。 退役后:
-
IntentRecognizer、模式匹配意图/实体和相关参数已不可用。 - 现有应用程序必须删除直接语音 SDK 意图逻辑,并采用两步方法(语音转文本,然后进行意图分类)或基于单一提示的方法。
选择替代项
| Requirement | 建议的服务 | 为什么 |
|---|---|---|
| 使用带标签的训练数据进行结构化意向和实体提取 | 语言服务对话语言理解 (CLU) | 专为多意向分类和实体提取而构建;支持版本、测试和分析。 |
| 多语言语音输入流入一致的意向架构 | 语音识别(STT) + 语义理解(CLU) | 语音处理听录;CLU 处理规范化和分类。 |
迁移步骤
- 将任何语音 SDK
IntentRecognizer的用法替换为SpeechRecognizer或ConversationTranscriber,以便获取文本。 - 对于结构化意向/实体需求,请创建 CLU 项目并部署模型。 将转录的话语发送到 CLU 预测 API。
- 从配置中删除对
LanguageUnderstandingModel、任何 LUIS 应用程序 ID 和终结点的依赖。 - 消除引用
PatternMatchingIntent或PatternMatchingEntity类型的模式匹配代码。 - 通过将历史
IntentRecognizer输出与 CLU 分类结果或 OpenAI 完成进行比较、根据需要调整训练数据或提示来验证准确性。 - 更新监视:将任何现有意向延迟/准确性仪表板迁移至新的源(CLU 评估日志或 OpenAI 提示结果跟踪)。
示例体系结构
- 语音转文本将音频转录为具有实时或批处理模式的文本。
- 响应规范化为常见的 JSON 形状(例如:
{ "intent": "BookFlight", "entities": { "Destination": "Seattle" } }) 。 - 业务逻辑将规范化输出路由到下游服务(预订、知识库、工作流引擎)。
结果格式注意事项
| 方面 | CLU |
|---|---|
| 架构稳定性 | 高(定义的意向/实体) |
| 版本控制 | 内置模型版本 |
| 培训工作 | 需要标记的数据集 |
| 边缘事例 | 需要更多标记的数据 |
| 延迟 | 预测 API 调用 |
常见问题
是否需要重新标记数据? 如果使用 LUIS,则需要将数据导出并重新导入 CLU,然后重新训练。 映射通常是直接的(意图、实体)。 模式匹配的意图可能需要手动转换为示例。
说话人分割是否受到影响? 否。 分割功能继续可用;只需在听录后通过 CLU 或 OpenAI 处理每个演讲者片段即可。