Azure AI 搜索中的新增功能

了解 Azure AI 搜索的功能、文档和示例的最新更新。

注意

预览功能在此处公布,但我们还会维护预览功能列表,以便你可以在一个位置找到这些功能。

2025 年 3 月

类型 描述
定价层更改(预览版) 服务 更改搜索服务的 定价层 。 这样可以灵活地缩放存储、增加请求吞吐量,并根据需要降低延迟。 在此预览版中,只能在基本层和标准层(S1、S2 和 S3)之间更改。 可在 更新服务(2025-02-01-preview) 和 Azure 门户中使用。
分面层次结构、聚合和分面筛选器(预览版) 查询 新的分面查询参数支持嵌套分面。 对于数值可分面字段,可以对每个字段的值求和。 还可以在维度指定筛选器以添加包含或排除条件。 可在 搜索文档(2025-03-01-preview) 和 Azure 门户中使用。
使用全精度向量对二进制量化的向量查询重新进行评分(预览版) 查询 对于包含二进制量化的向量索引,可以使用全精度向量查询重新评分查询结果。 查询引擎使用二进制嵌入的点积与矢量查询进行重新评分,从而提高搜索结果的质量。 设置 enableRescoringdiscardOriginals 来使用此功能,并在请求中调用最新的预览 API 版本。
语义排名器预发布模型 (预览版) 索引 如果某个模型恰好在你的区域中可用,请选择使用预发布语义排名器模型。 可在 “创建”或“更新索引”(2025-03-01-preview)中使用。
Search Service REST 2025-03-01-preview 休息 用于数据平面操作的 REST API 公共预览版。 添加了对多向量嵌入、分层分面、分面聚合和分面筛选器的支持。
搜索管理 2025-02-01-preview 休息 针对控制平面操作的 REST API 公开审查发布。 添加了对就地升级到更高容量分区、就地升级到更高层和 Azure 机密计算的支持。

2025 年 2 月

类型 描述
对托管 HSM 的客户管理的密钥支持 安全性 使用 Azure Key Vault 或 Azure Key Vault 托管 HSM(硬件安全模块)存储客户管理的密钥,以额外加密敏感内容。

2024 年公告

类型 公告
12 月 模板 RAG 与 Azure AI 搜索 + Python 聊天。 用于使用 Azure AI 搜索和 Python 生成 RAG 解决方案的 AI 应用程序模板。
11 月 安全性 网络安全边界。 将搜索服务加入网络安全外围,以控制对搜索服务的网络访问。 2024-06-01-preview 中的 Azure 门户和管理 REST API 可用于查看和协调网络安全外围配置。
11 月 安全性 Azure AI 服务连接的共享专用链接支持。 用于内置技能处理的 Azure AI 连接现在可以使用连接上的共享专用链接进行专用。
11 月 相关性 压缩矢量的重新计分选项。 可以设置选项,以使用原始矢量(而不是压缩矢量)重新评分。 适用于使用二进制和标量压缩的 HNSW 和详尽 KNN 矢量算法。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 矢量搜索 存储较少的向量实例。 在矢量压缩方案中,如果不需要全精度矢量进行重新评分,则可以省略其存储。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 相关性 在语义重排器中查询重写。 可以在语义查询上设置选项,将查询输入重写为经过修订或扩展的查询,以便从 L2 排序器生成更相关的结果。 搜索文档 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 相关性 新的语义排名器模型。 语义排序器在所有受支持的区域中与改进的模型一起运行。 API 或 Azure 门户体验没有变化。
11 月 应用 AI(技能) 文档布局技能。 用于分析文档结构的新技能,并提供结构感知(段落)分块。 此技能调用文档智能并使用文档智能布局模型。 在选定区域的创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 应用 AI(技能) Azure AI 技能处理的无密钥计费。 现在可以将托管标识和角色用于与 Azure AI 服务的无密钥连接,以便进行内置技能处理。 此功能消除了在同一区域中同时提供搜索和 AI 服务的限制。 创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 索引器数据源 Markdown 分析模式。 使用此分析模式,索引器可以从 Azure 存储和 OneLake 中的 Markdown 文件生成一对一或一对多的搜索文档。 创建或更新索引器 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 API(应用程序编程接口) 2024-11-01-preview。 查询重写、文档布局技能、技能处理无密钥计费、Markdown 分析模式以及压缩矢量的重新评分选项的 REST API 预览版本。
11 月 功能 门户对结构化数据的支持。 “导入和矢量化数据”向导现支持 Azure SQL、Azure Cosmos DB 和 Azure 表存储。
10 月 功能 解压缩 @search.score 以查看混合搜索结果中的子分数。 可以通过查看最终合并和评分结果的单个查询子评分来调查倒数排名融合 (RRF) 排名结果。 新的 debug 属性会解压缩搜索分数。 QueryResultDocumentSubscoresQueryResultDocumentRerankerInputQueryResultDocumentSemanticField 提供额外的详细信息。 2024-09-01-preview 中提供了这些定义。
10 月 功能 将混合搜索中的目标筛选器限定为矢量查询。 混合查询的筛选器涉及请求的所有子查询,无论类型如何。 可以替代全局筛选器,以将筛选器范围限定为特定的子查询。 新的 filterOverride 参数可在使用 2024-09-01-preview 的混合查询中使用。
10 月 应用 AI(技能) 文本拆分技能(标记分块)。 此技能具有新的参数,可改善嵌入模型的数据分块。 新的 unit 参数可让你指定标记分块。 现在可以按标记长度分块,将长度设置为对嵌入模型有意义的值。 还可以指定 tokenizer 和任何在数据分块期间不应拆分的标记。 新的 unit 参数和查询子分数定义可在 2024-09-01-preview 中找到。
10 月 API(应用程序编程接口) 2024-09-01-preview。 预览版 REST API,用于 text-embedding-3 模型中的已截断维度、混合查询的目标矢量筛选、对应于调试的 RRF 子分数详细信息,以及适用于文本拆分技能的标记分块。
10 月 功能 门户对客户管理的密钥加密 (CMK) 的支持。 在 Azure 门户中创建新对象时,现在可以指定 CMK 加密并选择一个 Azure Key Vault 来提供密钥。
8 月 功能 调试会话改进。 有两个重要改进。 首先,现在可以调试集成矢量化和数据分块工作负载。 其次,调试会话经过了重新设计,使技能和映射的呈现更简化。 可以选择流中的一个对象,在侧面板中查看或编辑其详细信息。 以前使用的选项卡式布局完全替换为页面上的更多上下文敏感信息。
8 月 API(应用程序编程接口) 2024-07-01. REST API 的稳定版正式发布,支持矢量数据类型、矢量压缩以及在索引编制和查询期间的集成矢量化。
8 月 功能 集成向量化,宣布正式发布。 在索引期间进行技能驱动的分块和嵌入。
8 月 功能 Vectorizers。 宣布正式发布。 在查询执行期间进行文本到矢量转换。 Azure OpenAI 矢量器自定义 Web API 矢量器都已正式发布。
8 月 功能 AzureOpenAIEmbedding 技能。 宣布正式发布。 一种技能类型,可在索引编制期间调用 Azure OpenAI 嵌入模型来生成嵌入项。
8 月 功能 索引投影。 宣布正式发布。 技能组定义的一个组件,用于定义辅助索引的形状。支持一对多索引模式,其中,来自扩充管道的内容可以针对多个索引。
8 月 功能 二进制和标量量化。 宣布正式发布。 使用内置量化压缩内存和磁盘上的矢量索引大小。
8 月 功能 导入和矢量化数据向导。 宣布正式发布。 可创建包括数据分块和矢量化的完整索引管道的向导。 该向导可创建所有必要的对象和配置。 此版本添加了对 Azure 存储中的 Azure Data Lake 的向导支持。
8 月 功能 存储属性。 宣布正式发布。 布尔值,通过不存储可检索矢量来减少矢量索引的存储。
8 月 功能 vectorQueries.Weight 属性。 宣布正式发布。 在搜索操作中指定每个矢量查询的相对权重。
7 月 加速器 与数据聊天。 在 Azure 中运行的 RAG 模式的解决方案加速器,使用 Azure AI 搜索进行检索,并使用 Azure OpenAI 大型语言模型来创建对话式搜索体验。 带有示例数据的代码可用于财务顾问、合同审查和汇总等用例场景。
7 月 加速器 对话知识挖掘。 基于 Azure AI 搜索、Azure 语音和 Azure OpenAI 服务构建的解决方案加速器,允许客户从联系中心后的对话中提取可操作的见解。
7 月 加速器 生成你自己的 Copilot。 创建自己的自定义 Copilot 解决方案,使客户顾问能够在结构化和非结构化数据中利用生成 AI 的强大功能。 帮助客户优化日常任务,与更多客户建立更好的互动。
5 月 服务限制 每个层更高的容量和更多的矢量配额(相同的计费费率)。 对于大多数区域,2024 年 4 月 3 日之后创建的服务的标准 2 (S2)、标准 3 (S3) 和标准 3 高密度 (S3 HD) 现在可以使用更大的分区大小。 要获取更大的分区,请在提供较新的基础结构的区域中创建新服务

存储优化层(L1 和 L2)也有了更多容量。 L1 和 L2 客户必须创建新的服务,才能受益于更高的容量。 目前未提供就地升级。

额外容量现已在更多区域提供:德国北部、德国中西部、南非北部、瑞士西部,以及世纪互联运营的 Azure(得克萨斯州、亚利桑那州和弗吉尼亚州)。
5 月 功能 矢量相关性
混合查询相关性。 四项增强功能可提高矢量和混合搜索相关性。

首先,现在可以对矢量搜索结果设置阈值,排除低评分结果。

其次,查询体系结构中的更改在每个查询类型的查询管道末尾应用计分配置文件。 文档提升是一个常见的计分概要文件,现在它在矢量和混合查询上按预期工作。

第三,可以在混合查询中设置 MaxTextRecallSizecountAndFacetMode,以控制流入混合排名模型的 BM25 排名搜索结果的数量。

第四,对于矢量和混合搜索,可以加权矢量查询,以便在多查询请求中提升或降低其重要性。
5 月 功能 二进制向量支持Collection(Edm.Byte) 是新的受支持的数据类型。 此数据类型将打开与 Cohere v3 二进制嵌入模型 和自定义二进制量化的集成。 缩小数据类型可降低大型矢量数据集的成本。 有关详细信息,请参阅编制二进制数据索引以进行矢量搜索
5 月 技能 Azure AI 视觉多模式嵌入技能(预览版)。 绑定到 Azure AI 视觉的多模式嵌入 API 的新技能。 可以在编制索引期间为文本或图像生成嵌入。 此技能可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。
5 月 矢量化器 Azure AI 视觉矢量化器(预览版)。 新的矢量化器使用 多模式嵌入 API 连接到 Azure AI 视觉资源,以在查询时生成嵌入。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。
5 月 矢量化器 Azure AI Foundry 模型目录矢量化器(预览版)。 新的矢量化器可连接到从 Azure AI Foundry 模型目录部署的嵌入模型。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。

如何使用 Azure AI Foundry 中的模型实现集成的矢量化
5 月 技能 AzureOpenAIEmbedding 技能(预览版)支持 Azure OpenAI 上的更多模型。 现在支持 text-embedding-3-large 和 text-embedding-3-small,以及上一次更新中的 text-embedding-ada-002。 通过新的 dimensionsmodelName 属性,可以在 Azure OpenAI 上指定各种嵌入模型。 以前,维度限制固定在 1,536 个维度,仅适用于 text-embedding-ada-002。 更新的技能可通过 Azure 门户和 2024-05-01-preview REST API 获取。
5 月 门户 导入和向量化数据向导现在支持将 OneLake 索引器作为数据源。 对于嵌入,它还支持连接到 Azure AI 视觉多模式、Azure AI Foundry 模型目录,以及 Azure OpenAI 上的其他嵌入模型。

将字段添加到索引时,可以选择二进制数据类型

搜索资源管理器现在默认为 2024-05-01-preview,并支持向量和混合查询的新预览功能。
5 月 API(应用程序编程接口) 2024-05-01-preview。 搜索 REST API 的新预览版提供了新的技能和矢量化器、新的二进制数据类型、OneLake 文件索引器、用于获取更相关结果的新查询参数。 如果已有针对 2023-07-01-preview 编写的代码,并且需要迁移到此版本,请参阅升级 REST API
5 月 API(应用程序编程接口) Azure SDK beta 包。 查看以下 Azure SDK beta 版包的更改日志,以获取新功能支持:适用于 Python 的 Azure SDK适用于 .NET 的 Azure SDK适用于 Java 的 Azure SDK
4 月 API(应用程序编程接口) 解决信息泄露的安全更新。 GET 响应不再返回连接字符串或密钥。 适用于 GET 技能组、GET 索引和 GET 索引器。 此更改有助于保护与 AI 搜索集成的 Azure 资产免受未经授权的访问。
4 月 API(应用程序编程接口) 2024-03-01-preview 搜索 REST API
4 月 API(应用程序编程接口) 2024-03-01-preview 管理 REST API
4 月 API(应用程序编程接口) 2023-07-01-preview 弃用公告。 自 2024 年 7 月 8 日起,不再支持此版本。 较新的 API 版本具有不同的矢量配置。 请尽快迁移到较新版本
4 月 服务限制 基本层和标准层 以相同的每分区计费费率为每个分区提供更多存储。 额外的容量受区域可用性影响,适用于 2024 年 4 月 3 日之后新建的搜索服务。 基本层现在最多支持三个分区和三个副本。
4 月 服务限制 在所选区域 2024 年 4 月 3 日之后创建的新服务上,矢量配额更高
4 月 功能 矢量量化、窄向量数据类型和新stored属性(预览版)。 这三个功能共同降低了存储和成本。
2 月 功能 矢量字段的新维度限制。 最大维度限制现在提升到3072,而之前为2048

上一年的公告

服务品牌重塑

多年来,此服务有多个名称。 此处为逆时序顺序排列这些名称:

  • Azure AI 搜索(2023 年 11 月)已重命名,以符合 Azure AI 服务和客户预期。
  • Azure 认知搜索(2019 年 10 月)已重命名,以反映认知技能和 AI 处理在服务操作中更广泛的用途(但仍为可选)。
  • Azure 搜索(2015 年 3 月)原始名称。

服务更新

在 Azure 网站上可以找到 Azure AI 搜索的服务更新通告

功能重命名

2023 年 11 月,语义搜索已更名为语义排序器,以更好地描述现有结果集 L2 排序的功能。