Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure AI 搜索是一项完全托管的云服务,用于将数据连接到 AI。 该服务统一了对企业和 Web 内容的访问,以便代理和大型语言模型可以利用上下文、聊天历史记录和多种来源的信号来生成可靠、有理有据的答案。
常见用例包括 经典搜索 和新式检索增强生成(RAG),通过 代理检索。 这使得 Azure AI 搜索适用于企业和使用者方案,无论是将搜索功能添加到网站、应用、代理还是聊天机器人。
创建搜索服务时,可以解锁以下功能:
- 两个引擎: 经典搜索 单个请求和 代理检索 ,用于并行、迭代、LLM 辅助搜索。
- 针对本地(索引)和远程内容的全文、矢量、混合和多模式查询。
- AI 增强内容以进行分块、矢量化,并使原始内容可被搜索。
- 相关性优化以提高意向匹配和结果质量。
- Azure 缩放、安全性、监控和合规性。
- Azure 与受支持的数据平台、Azure OpenAI 以及 Microsoft Foundry 的集成。
为什么使用 Azure AI 搜索?
将基础代理和聊天机器人植根于专有、企业或 Web 数据中,以提供准确的上下文感知响应。
从 Azure Blob 存储、Azure Cosmos DB、Microsoft SharePoint、Microsoft OneLake 和其他受支持的数据源访问数据。 根据新鲜度、延迟和合规性需求选择索引访问或远程访问。
使用执行分块、嵌入和 LLM 辅助转换的技能,在索引编制或查询时丰富和结构化内容。
将全文搜索与矢量搜索(混合搜索)相结合,以平衡精度和召回率。
在单个多模式管道中查询包含文本和图像的内容。
轻松实现搜索相关的功能:相关性优化、分面导航、筛选器(包括地理空间搜索)、同义词映射和自动完成。
通过Microsoft Entra、Azure 专用链接、文档级访问控制和基于角色的访问提供企业安全性、访问控制和合规性。
依托 Azure 的可靠性、监控和诊断功能(包括日志、指标和警报)以及适用于自动化的 REST API 或 SDK 工具集,在生产环境中进行扩展和操作。
有关特定功能的详细信息,请参阅 Azure AI 搜索的功能。
什么是经典搜索?
经典搜索是用于可预测、低延迟查询的索引优先检索模型。 每个查询针对单个预定义的搜索索引,并在一个请求-响应周期中返回排名的文档。 检索期间不会发生 LLM 辅助的规划、迭代或合成。
在此体系结构中,搜索服务位于包含未处理内容和客户端应用的数据存储之间。 该应用负责将查询请求发送到搜索服务并处理响应。
此体系结构有两个主要工作负荷:
索引将 内容加载到索引中并使其可搜索。 在内部,入站文本将标记化并存储在倒排索引中,而入站向量存储在向量索引中。 Azure AI 搜索只能为 JSON 文档编制索引。 可以使用 推送方法 直接上传 JSON 文档或 拉取方法 (索引器或逻辑应用工作流),以检索数据并将其序列化为 JSON。
在编制索引期间,可以使用 AI 扩充 来分块文本、生成向量并应用创建结构和内容的其他转换。 然后,Azure AI 搜索将扩充的输出序列化为 JSON 文档,并将其引入索引。
注释
为了清楚起见,此关系图将索引和查询引擎分开,但在 Azure AI 搜索中,它们与在读写和只读模式下运行的组件相同。
什么是代理检索?
代理检索 是一个多查询管道,专为复杂的代理到代理工作流而设计。 每个查询都面向一个知识库,该 知识库 表示一个完整的知识领域。 代理参考知识库以确定要依托的内容,而知识库负责处理如何执行基础建立。
一个知识库包含一个或多个 知识库、用于查询规划和答案合成的可选 LLM 以及用于控制检索行为的参数。 每个查询都会进行规划、分解为重点子查询、从知识源进行并行检索、语义重制和结果合并。 三管齐下的应对措施针对代理消耗进行了优化。
在后台,代理检索基于经典搜索体系结构构建,方法是添加协调多源检索的上下文层(知识库)。 知识源可以编制索引或远程:索引源使用与经典搜索相同的索引和查询引擎,而远程源绕过索引编制并实时查询。
它们的比较方式
经典搜索和代理检索是信息检索的互补模式。 两者都支持 全文、 矢量、 混合和 多模式 搜索。 但它们在内容摄取和查询的方式上存在差异。 下表总结了它们的主要差异。
| 方面 | 经典搜索 | 代理检索 |
|---|---|---|
| 搜索语料库 | 搜索索引 | 知识来源 |
| 搜索目标 | 由架构定义的一个索引 | 一个指向一个或多个知识源的知识库 |
| 查询计划 | 没有计划,只是一个请求 | LLM辅助方案或用户提供方案 |
| 查询请求 | 在索引中搜索文档 | 从知识源检索 |
| 响应 | 基于模式的扁平化搜索结果 | LLM 制定的答案或原始源数据、活动日志、参考 |
| 区域限制 | 否 | 是的 |
| 状态 | 普遍可用 | 公共预览 |
如何开始使用
可以通过 Azure 门户、REST API 和适用于 .NET、Java、JavaScript 和 Python 的 Azure SDK 访问 Azure AI 搜索。
门户适用于服务管理和内容管理,其中包含用于原型制作知识库、知识库、索引、索引器、技能集和数据源的工具。 REST API 和 SDK 对于生产自动化非常有用。
选择路径
在开始之前,请使用此清单做出关键决策:
选择搜索引擎: 如果不使用代理或聊天机器人,经典搜索可以满足大多数应用需求,其成本和复杂性比 LLM 集成要低。 如果希望知识库和多个知识库的优势,而无需完整的 LLM 业务流程,请考虑以最少的 推理工作量进行代理检索。
选择一个区域: 如果使用代理检索,请选择 受支持的区域。 对于经典搜索,请选择提供所需功能和容量的区域。
为索引绑定内容选择引入方法: 如果内容位于 受支持的数据源中,请使用 拉取方法 检索数据并将其序列化为 JSON。 如果没有受支持的数据源,或者内容和索引必须实时同步, 推送方法 是唯一的选项。
是否需要向量? LLM 和代理不需要向量。 仅当需要相似性搜索或具有可同质化为矢量的内容时,才使用它们。 Azure AI 搜索为此任务提供 集成的矢量化 。
是否需要基于用户的权限继承? 远程 SharePoint 是为此场景设计的;但你也可以继承附加到 Azure Blob 存储或 ADLS Gen2 中内容的用户权限。 对于所有其他方案,可以使用 安全筛选器 解决方法。
选择学习资源
提示
有关复杂或自定义解决方案的帮助, 请联系 Azure AI 搜索中具有深入专业知识的合作伙伴。