Azure AI 搜索中的矢量搜索

矢量搜索是一种信息检索方法，支持对内容的数字表示形式进行索引和查询。由于内容是数字而不是纯文本，因此匹配基于与查询向量最相似的向量。此方法可实现跨以下项目匹配：

本文概述了Azure AI 搜索中的矢量搜索，包括支持的方案、可用性和其他Azure服务的集成。

小窍门

想要立即开始？执行以下步骤：

矢量搜索支持哪些场景？

矢量搜索支持以下方案：

相似性搜索。分别使用嵌入模型或开源模型（如 SBERT）对文本进行编码。然后，使用也编码为矢量的查询检索文档。
混合搜索。 Azure AI 搜索将混合搜索定义为在同一请求中执行矢量搜索和 keyword 搜索。矢量支持在域级实现。如果索引包含向量和非函数字段，则可以编写面向两者的查询。查询并行执行，结果合并为单个响应并相应地进行排名。
多模式搜索。
多语言搜索。 Azure AI 搜索专为扩展性而设计。如果您拥有以多种语言训练的嵌入模型和聊天模型，可以通过索引端的自定义或内置技能，或通过查询端的向量化工具来调用它们。为了更好地控制文本翻译，可以在混合搜索方案中使用 Azure AI 搜索支持的多语言功能，以处理非向量内容。
筛选的矢量搜索。查询请求可以包含矢量查询和筛选表达式。筛选器适用于文本和数值字段。它们对于元数据筛选器以及根据筛选条件包括或排除搜索结果非常有用。虽然矢量字段不可筛选，但可以设置可筛选的文本或数字字段。搜索引擎可以在执行向量查询之前或之后处理筛选器。
矢量数据库。 Azure AI 搜索存储您查询的数据。当你需要长期记忆、知识库，或用于检索增强生成（RAG）架构和以矢量为基础的应用程序的数据时，可以将其用作纯矢量索引。

Azure AI 搜索支持对搜索索引中的矢量嵌入进行索引、存储和查询。下图显示了矢量搜索的索引编制和查询工作流。

在索引端，Azure AI 搜索使用最近邻算法将相似的向量在索引中靠近放置。在内部，它会为每个向量字段创建矢量索引。

如何将源内容的嵌入表示引入Azure AI 搜索取决于您的处理方法：

对于内部处理，Azure AI 搜索在索引器管道中提供集成的数据分块和向量化。然后Azure AI 搜索进行调用并处理转换。此方法需要索引器、受支持的数据源和驱动分块和嵌入的技能组。
对于外部处理，可以在 Azure AI 搜索外部生成嵌入，并将预向量化的内容直接推送到搜索索引中的 vector 字段。

在查询端，客户端应用通常通过提示收集用户输入。可以添加编码步骤来向量化输入，然后将向量查询发送到Azure AI 搜索索引进行相似性搜索。与索引一样，可以使用集成矢量化对查询进行编码。对于任一方法，Azure AI 搜索会返回结果中请求的 k 最近邻（kNN）文档。

Azure AI 搜索支持hybrid 方案并行运行矢量和关键字搜索，并返回统一的结果集，这通常比仅矢量或关键字搜索提供更好的结果。对于混合搜索，向量和非向量内容都被引入到同一个索引中，用于处理同时运行的查询。

矢量搜索在所有区域和所有层上均免费提供。但是，生成嵌入向量或使用 AI 扩充进行矢量化可能会产生模型提供者收取费用。

若要通过门户和编程方式访问矢量搜索，可以使用：

注意

在 2019 年 1 月 1 日之前创建的一些搜索服务不支持矢量工作负荷。如果你在尝试将矢量字段添加到架构时收到错误，则原因是服务已过时。在这种情况下，必须创建新的搜索服务来试用矢量功能。
在 2024 年 4 月 3 日之后创建的搜索服务为矢量索引提供更高的配额。

Azure AI 搜索在 Azure AI 平台中深度集成。下表列出了在矢量工作负荷中有用的产品。

产品	集成
Azure AI 服务	图像检索矢量化图像 API 支持图像内容的矢量化。我们建议使用此 API 来生成图像嵌入。
人工智能服务代理	在 Azure AI 搜索中，可以创建一个指向包含向量字段和向量分析器的搜索索引的已编制索引的知识源。然后，可以将知识库父级到知识库，并将知识库连接到 AI 服务代理服务，为代理提供矢量搜索结果，以增强知识检索。
Azure数据平台：Azure Blob 存储、Azure Cosmos DB、Azure SQL、Azure OneLake	可以使用索引器自动执行数据引入，然后使用集成矢量化来生成嵌入。 Azure AI 搜索可以自动为Azure blob 索引器、Azure Cosmos DB for NoSQL 索引器、Azure Data Lake Storage Gen2、Azure 表存储自动索引向量数据。有关详细信息，请参阅将矢量字段添加到搜索索引。

它通常用于开源框架，如 LangChain。