注释
某些智能检索功能在2026-04-01 REST API版本中通过编程访问已普遍可用。
如果选择使用预览版 REST API 版本,则可以访问尚未正式提供的代理检索功能。 预览版功能在没有服务级别协议的情况下提供,不建议用于生产工作负荷。
重要
这些特性和功能是 2026-05-01 预览版 REST API 的一部分。 2026-05-01-preview 作为Azure订阅的一部分获得许可,并受Microsoft产品条款、Microsoft产品和服务数据保护附录(“DPA”)和Azure预览版补充使用条款的约束。
2026-05-01-preview 支持连接到其他 Microsoft 服务和第三方服务。 使用这些服务受其各自的条款的约束,可能会导致数据处理或存储超出Azure符合性边界,以及流入Azure符合性边界的数据。
您有责任管理您的数据是否会流出您组织的合规和地理边界之外及其任何相关影响,并确保已配置适当的权限、边界和审批。
你负责仔细查看和测试在特定用例上下文中生成的应用程序,并做出所有适当的决策和自定义。 这包括实施自己的负责任的 AI 缓解措施,例如元系统、内容筛选器或其他安全系统,并确保应用程序满足适当的质量、可靠性、安全性和可信度标准。
在 Azure AI 搜索中, 代理检索 是一个多查询管道,专为聊天和 copilot 应用中的用户或代理提出的复杂问题而设计。 它适用于 检索扩充的生成(RAG)模式和代理间工作流。
下面是它的作用:
可以使用大型语言模型(LLM)将复杂查询分解为较小的、重点的子查询,以便更好地覆盖专有内容和外部内容。 子查询可以包含聊天历史记录,以提供额外的上下文。
并行运行子查询。 每个子查询都会进行语义重排序,以提升最相关匹配结果的排名。
将最佳结果整合为统一回复,供 LLM 用于生成有依据的答案。
可以返回源引用和活动日志以及合并的内容,以便仅使用基础数据或将其传递给 LLM 以获取完整答案。
这一高性能管道可帮助你为聊天应用程序生成高质量的依据数据或答案,并具备快速回答复杂问题的能力。
为何使用代理检索?
如果要为代理和应用提供最相关的内容来回答更难的问题、基于聊天上下文、专有内容和外部源,请使用代理检索。
与单一查询管道相比,代理检索会增加延迟,但它处理单个查询无法处理的查询复杂性。 例如,它可以处理:
包含多个要求的问题,例如“帮我找一家靠近海滩、提供机场接送服务,并且步行即可到达素食餐厅的酒店。”
依赖于对话中早期上下文的问题。
适合通过重写来提升效果的查询,可借助同义词映射和由 LLM 生成的释义改写,扩大对您的内容的覆盖范围。
拼写错误。
体系结构和工作流
代理检索过程如下所示:
工作流启动: 应用程序使用提供查询和聊天历史记录的检索操作调用知识库。
查询规划:在
low和medium检索推理强度下,知识库会将您的查询和对话历史记录发送给 LLM,由其生成聚焦的子查询。 此时minimal会跳过此步骤,并将查询直接颁发给知识源。 推理强度默认值为low,并在知识库中配置。查询执行: 知识库将子查询发送到您的知识源。 所有子查询同时运行,可以是关键字、矢量或混合搜索。 每个子查询都会进行语义重新调整,以查找最相关的匹配项。 引用资料被提取并保留以供引证。
结果合成: 系统将所有结果合并为统一响应。 始终返回的是合并后的内容。 源引用和执行活动日志是可选的。
Components
对于所有代理式检索场景,都需要一个知识库和至少一个知识源。 其他组件是可选的,取决于你的配置。
| 组件 | 服务 | 角色 |
|---|---|---|
| 知识库 | Azure AI 搜索 | 协调管道,管理知识源和查询参数。 |
| 知识来源 | Azure AI 搜索 | 定义管道中使用的内容。 可以编制索引(由服务上的搜索索引支持)或远程(在查询时从外部平台检索的内容)。 |
| 搜索索引 | Azure AI 搜索 | 使用语义配置存储可搜索内容(文本和矢量)。 确定运行哪些查询类型以及哪些优化适用。 仅对已编入索引的知识源是必需的。 |
| 语义排序器 | Azure AI 搜索 | 代理检索管道在内部用于重新检索相关性结果(L2 重新调用)。 |
集成需求
应用程序通过调用knowledge base并处理响应来驱动管道。 该管道会返回基础依据数据,您可以将其传递给 LLM 以生成答案,也可以直接在对话界面中使用。
如何开始
若要创建代理检索解决方案,可以使用Azure门户、REST API 或提供功能的Azure SDK包。