Azure AI 搜索中的新增功能

了解 Azure AI 搜索的功能、文档和示例的最新更新。

注意

预览功能在此处公布,但我们还会维护预览功能列表,以便你可以在一个位置找到这些功能。

2025 年 11 月

Item 描述
Search Service 2025-11-01-preview 新的预览版 REST API 版本,提供对此表中所述的数据平面操作的编程访问。
免费等级上的语义排序器和主动检索 语义排名器和代理检索现已在 选定区域中的免费层上提供,但查询量受限制。
知识代理重命名为知识库 知识代理现在称为知识库。 知识来源保持不变。 此重命名引入了 REST API 路由和属性的重大更改。 有关迁移的帮助,请参阅 迁移代理检索代码
知识库(预览版) 从知识代理重命名后,知识库现在支持新的 retrievalInstructions 属性和 outputConfiguration 属性,以便改进查询规划和执行控制。 它还为控制 LLM 处理提供了新的 推理途径
知识检索(预览版) 执行支持推理工作量、零模型调用的模式以实现效率和部分响应的检索操作。
门户对知识源和知识库的支持(预览版) 使用 Azure 门户创建和管理知识源和知识库,以及用于发送检索请求的新聊天场。 这些门户生成的对象使用 2025-08-01-preview 架构,并且与 2025-11-01-preview 存在重大差异。 有关迁移的帮助,请参阅 迁移代理检索代码
Foundry IQ (预览版) 新的集成,允许 Foundry 代理服务中的代理调用 Azure AI 搜索中的知识库。 Foundry IQ 将复杂的检索作卸载到知识库,使代理能够基于企业数据和 Web 源提供准确的引文支持响应。
Azure 内容理解技能(预览版) 新技能,可将 Azure 内容理解包装在 Foundry Tools 中,以从文本、图像、PDF、Microsoft PowerPoint、Microsoft Word 等中提取结构化的 Markdown。 此技能通过更好的表提取(包括跨页表)、图像说明和语义分块提供高级文档分析。 对于索引知识源,可通过 contentExtractionMode 中的 ingestionParameters 属性获得此技能。
ACL 的加强读取权限(预览版) 新功能,可为管理员分配提升的读取权限,以便其调查文档访问控制所用 ACL 配置的问题。
文档级敏感度标签索引(预览版) 与 Azure Purview 的新集成,用于将文档敏感度标签同步到索引,在查询时遵循其标签和保护,以便进行数据治理。
评分函数聚合(预览版) 组合和聚合多个评分函数的新功能,可实现更复杂的相关性自定义和加权信号组合。
Facet 聚合 (预览版) 新的 facet 聚合操作(包括最小值、最大值、平均值和基数),可在分面搜索体验中提供增强的分析。
azure-api.net 终结点支持(预览版) Azure OpenAI 嵌入技能Azure OpenAI 向量器现在接受 azure-api.net Azure API 管理的终结点(而不是自定义终结点)。
services.ai.azure.com 端点支持 GenAI 提示技能Azure OpenAI 嵌入技能Azure OpenAI 向量化器AI 扩充现在接受 services.ai.azure.com Azure Foundry 资源的终结点。 在从 Azure OpenAI 升级到 Foundry时,会自动创建一个新项目,且该项目会在导入数据(新)向导中可用于 RAG 和多模式 RAG。

2025 年 9 月

Item 描述
文档布局技能 正式发布。
规范化器 正式发布。
索引说明 正式发布。
重新记录二元量化向量 正式发布。
标量压缩向量的重新评分选项 正式发布。
语义排名结果的计分配置文件 正式发布。
截断维度 正式发布。
解压缩 @search.score 以查看混合搜索结果中的子分数 正式发布。
导入向导的更新(阶段 1) Azure 门户正在进行三个阶段的推出,以合并两个导入向导。 对于阶段 1, 导入和矢量化数据 向导已重命名为 导入数据(新), 并重新开发以支持关键字搜索,使用改进的界面和用户体验将旧 导入数据 工作流现代化。

“导入数据(新增)”向导不是旧版向导的直接替代。 例如,它支持较少的关键字搜索技能,不提供内置示例数据。

这两个向导目前都可用,但将来阶段将弃用 导入数据

对 Azure 机密计算的支持 在创建服务期间配置 机密计算 ,以处理机密 VM 上使用的数据。 此计算类型不适用于常规用途,而是适用于严格的法规、合规性或安全要求。

机密计算会在可计费等级的基本成本上增加 10% 的附加费。 有关详细信息,请参阅定价页

现已通过 2025-05-01 版本的 服务 - 创建或更新(REST API)Azure 门户正式上线。

2025 年 8 月

Item 描述
Search Service 2025-08-01-preview 新的预览版 REST API 版本,提供对此表中所述的数据平面操作的编程访问。
知识代理(预览版) 知识代理定义在体系结构上进行了更改,现在需要一个或多个 knowledgeSources 而不是 targetIndexes 并弃用了 defaultMaxDocsForReranker。 新的 retrievalInstructionsoutputConfiguration 属性可以更好地控制查询规划和执行。 如需中断性变更方面的帮助,请参阅迁移智能体检索代码
知识来源(预览版) 用于创建和管理知识来源的新 REST API,这些来源表示知识代理用于建立依据和回答查询的内容。 在此预览版中,可以为搜索索引Azure Blob 创建知识来源。
答案合成(预览版) 知识代理的新 answerSynthesis 形式。 指定后,LLM 会生成自然语言答案作为检索管道中的嵌入步骤。 这不同于默认 extractiveData 形式,后者返回用于下游处理的原始搜索结果。
知识代理的“快速路径”(预览版) (在 2025-11-01-preview 中删除。本文档不再存在。 如果查询简洁且初始响应足够相关,知识代理中的attemptFastPath布尔功能启用更短的处理时间。 替换特性是最小化的检索推理工作量。
检索说明(预览版) 知识智能体的新 retrievalInstructions 属性将指导智能体检索工作流中的查询规划。 例如,可以指定包括或排除特定知识来源的条件。
改进的索引器运行时跟踪信息(预览版) 仅适用于标准 3 高密度 (S3 HD) 服务。 获取服务统计信息响应现在为整个服务提供累积索引器处理信息。 获取状态 - 索引器提供相同的信息,但针对特定索引器。
矢量查询的严格后期筛选(预览版) strictPostFilter 参数的新 vectorFilterMode 模式。 指定后,在标识全局前 k 个矢量结果后应用筛选器,确保返回的文档是未筛选结果的子集。
增加了向量字段的最大维度 每个向量字段的最大维度现在为 4096。 此更新适用于支持向量且不会引入中断性变更的所有稳定版和预览版 REST API 版本。

2025 年 7 月

Item 描述
搜索管理 2025-05-01 此表所述的控制平面操作的 REST API 已稳定发布。 有关迁移指南,请参阅 升级到 Azure AI 搜索中的最新 REST API
定价层更改 现已通过 属性在 更新服务(REST API)和 Azure 门户 中普遍可用。
用户指定的托管身份分配 现在通过 identity 属性正式发布,该属性将用户分配的托管标识与搜索服务配置相关联。 只有通过 更新服务(REST API) 或 Azure 门户的分配步骤是普遍可用的。 用于包含用户分配的托管标识的数据源或模型连接的 API 仍处于预览状态。
网络安全边界 现在可通过 Azure 虚拟网络管理器 REST API 正式发布,这些 API 用于加入搜索服务,以及用于查看和同步配置设置的 搜索管理 REST API。 对两个步骤的门户支持也已普遍提供。

2025年5月

描述
代理检索(预览版) 创建由大型语言模型(LLM)和专有数据提供支持的对话搜索体验。 能动检索将复杂的用户查询分解为子查询,并行执行子查询,并从 Azure AI 搜索所索引的文档中提取基础数据。 输出适用于代理和自定义聊天解决方案。 此预览版中引入了新的 知识代理 对象。 其 响应有效负载 专为下游代理和聊天模型使用而设计,查询计划和参考数据完全透明。 若要开始在门户中使用,请参阅快速入门:代理检索
多维函数支持(预览版) 为单个文档字段中的多个子向量编制索引。 现在可以在复杂集合的嵌套字段中使用矢量类型,从而有效地允许多个向量与单个文档相关联。
使用语义排名的评分配置文件(预览版) 语义排名器会添加新字段, @search.rerankerBoostedScore以帮助保持一致的相关性,并更好地控制搜索管道中的最终排名结果。
文档级访问控制(预览版) 将 Azure Data Lake Storage ADLS Gen2 中的 Blob 的文档级权限传递到索引中的可搜索文档。 现在,查询可以根据所选数据源的用户标识筛选结果。
多模式搜索(预览版) 引入、理解和检索包含文本和图像的文档,使你能够执行各种形式组合的搜索,例如查询与文本以查找嵌入相关复杂图像中的信息。 请参阅 快速启动:搜索多模式内容 以获取门户向导支持,并查看 Azure AI 搜索多模式 RAG 演示 以获取代码优先方法。
GenAI 提示技能(预览版) 使用你提供的提示连接到大型语言模型 (LLM) 以获取信息的新技能。 使用此技能,可以使用 LLM 中的内容填充可搜索字段。 此技能的主要用例是 图像语言化,使用 LLM 描述图像并将说明发送到索引中的可搜索字段。
文档布局技能(预览版) 如果使用 2025-05-01-preview API 版本或更高版本,则可以使用此技能的新参数。 新参数支持图像偏移元数据,从而改善图像搜索体验。
导入和矢量化数据向导增强功能 此向导提供用于创建和填充矢量索引的两个路径: 检索扩充生成(RAG)多模式 RAG。 逻辑应用集成通过 RAG 路径。
索引“说明”支持(预览版) 最新的预览 API 向索引添加说明。 请考虑模型上下文协议 (MCP) 服务器,该服务器必须在运行时选取正确的索引。 决策可以基于说明而不是仅基于索引名称。 说明必须是人可读的,并且字符数必须低于 4000 个字符。
2025-05-01-预览版 新的数据平面预览 REST API 版本,提供对此版本中宣布的预览功能的编程访问。

2025 年 4 月

描述
RAG 时间旅程 使用 Azure AI 搜索的检索扩充生成(RAG)工作流的代码和视频演示。 段包括基础知识、模式和用例、 大规模矢量索引以及使用代理评估结果并生成更好的答案的 代理搜索

2025 年 3 月

描述
定价层更改(预览版) 更改搜索服务的 定价层 。 这样可以灵活地缩放存储、增加请求吞吐量,并根据需要降低延迟。 最初,此预览版仅支持基本层和标准层(S1、S2 和 S3)之间的升级,但从 2025 年 7 月开始,它支持升级 降级这些层。 可在 更新服务(2025-02-01-preview) 和 Azure 门户中使用。
分面层次结构、聚合和分面筛选器(预览版) 新的分面查询参数支持嵌套分面。 对于数值可分面字段,可以对每个字段的值求和。 还可以在维度指定筛选器以添加包含或排除条件。 可在 搜索文档(2025-03-01-preview) 和 Azure 门户中使用。
使用全精度向量对二进制量化的向量查询重新进行评分(预览版) 对于包含二进制量化的向量索引,可以使用全精度向量查询重新评分查询结果。 查询引擎使用二进制嵌入的点积与矢量查询进行重新评分,从而提高搜索结果的质量。 设置 enableRescoringdiscardOriginals 来使用此功能,并在请求中调用最新的预览 API 版本。
语义排名器预发行版模型(预览版) 如果某个模型恰好在你的区域中可用,请选择使用预发布语义排名器模型。 可在 “创建”或“更新索引”(2025-03-01-preview)中使用。
Search Service REST 2025-03-01-preview 用于数据平面操作的 REST API 公共预览版。 添加了对多向量嵌入、分层分面、分面聚合和分面筛选器的支持。
搜索管理 2025-02-01-preview 针对控制平面操作的 REST API 公开审查发布。 添加了对就地升级到更高容量分区、就地升级到更高层和 Azure 机密计算的支持。

2025 年 2 月

描述
对托管 HSM 的客户管理的密钥支持 使用 Azure Key Vault 或 Azure Key Vault 托管 HSM(硬件安全模块)存储客户管理的密钥,以额外加密敏感内容。

2024 年公告

类型 公告
12 月 模板 RAG 与 Azure AI 搜索 + Python 聊天。 用于使用 Azure AI 搜索和 Python 生成 RAG 解决方案的 AI 应用程序模板。
11 月 安全性 网络安全边界。 将搜索服务加入网络安全外围,以控制对搜索服务的网络访问。 2024-06-01-preview 中的 Azure 门户和管理 REST API 可用于查看和协调网络安全外围配置。
11 月 安全性 Azure AI 服务连接的共享专用链接支持。 用于内置技能处理的 Azure AI 连接现在可以使用连接上的共享专用链接进行专用。
11 月 相关性 压缩矢量的重新计分选项。 可以设置选项,以使用原始矢量(而不是压缩矢量)重新评分。 适用于使用二进制和标量压缩的 HNSW 和详尽 KNN 矢量算法。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 矢量搜索 存储较少的向量实例。 在矢量压缩方案中,如果不需要全精度矢量进行重新评分,则可以省略其存储。 创建或更新索引 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 相关性 在语义重排器中查询重写。 可以在语义查询上设置选项,将查询输入重写为经过修订或扩展的查询,以便从 L2 排序器生成更相关的结果。 搜索文档 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 相关性 新的语义排名器模型。 语义排序器在所有受支持的区域中与改进的模型一起运行。 API 或 Azure 门户体验没有变化。
11 月 应用 AI(技能) 文档布局技能。 用于分析文档结构的新技能,并提供结构感知(段落)分块。 此技能在 Foundry Tools 中调用 Azure 文档智能并使用 Azure 文档智能布局模型。 在选定区域的创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 应用 AI(技能) Azure AI 技能处理的无密钥计费。 现在,可以使用托管标识和角色来与 Foundry 工具建立无键连接,以便进行内置技能处理。 此功能消除了在同一区域中同时具有搜索和 Foundry 工具的限制。 创建或更新技能组 (2024-11-01-preview)、Azure 门户和提供此功能的 Azure SDK beta 包中提供了此选项。
11 月 API 2024-11-01-preview。 查询重写、文档布局技能、技能处理无密钥计费、Markdown 分析模式以及压缩矢量的重新评分选项的 REST API 预览版本。
11 月 功能 门户对结构化数据的支持。 “导入和矢量化数据”向导现支持 Azure SQL、Azure Cosmos DB 和 Azure 表存储。
10 月 功能 降低 MRL 训练的文本嵌入模型在 Azure OpenAI 上的维度要求。 Text-embedding-3-small 和 Text-embedding-3-large 是使用套娃表示学习 (MRL) 方法训练的。 这样你就可以将嵌入矢量截成更少的维度,并调整矢量索引大小使用和检索质量之间的平衡。 truncationDimension 中的新增 功能允许在文本嵌入模型中访问 MRL 压缩。 只能为新的矢量字段配置它。
10 月 功能 解压缩 @search.score 以查看混合搜索结果中的子分数。 可以通过查看最终合并和评分结果的单个查询子评分来调查倒数排名融合 (RRF) 排名结果。 新的 debug 属性会解压缩搜索分数。 QueryResultDocumentSubscoresQueryResultDocumentRerankerInputQueryResultDocumentSemanticField 提供额外的详细信息。 2024-09-01-preview 中提供了这些定义。
10 月 功能 将混合搜索中的目标筛选器限定为矢量查询。 混合查询的筛选器涉及请求的所有子查询,无论类型如何。 可以替代全局筛选器,以将筛选器范围限定为特定的子查询。 新的 filterOverride 参数可在使用 2024-09-01-preview 的混合查询中使用。
10 月 应用 AI(技能) 文本拆分技能(标记分块)。 此技能具有新的参数,可改善嵌入模型的数据分块。 新的 unit 参数可让你指定标记分块。 现在可以按标记长度分块,将长度设置为对嵌入模型有意义的值。 还可以指定 tokenizer 和任何在数据分块期间不应拆分的标记。 新的 unit 参数和查询子分数定义可在 2024-09-01-preview 中找到。
10 月 API 2024-09-01-preview。 预览版 REST API,用于 text-embedding-3 模型中的已截断维度、混合查询的目标矢量筛选、对应于调试的 RRF 子分数详细信息,以及适用于文本拆分技能的标记分块。
10 月 功能 门户对客户管理的密钥加密 (CMK) 的支持。 在 Azure 门户中创建新对象时,现在可以指定 CMK 加密并选择一个 Azure Key Vault 来提供密钥。
8 月 功能 调试会话改进。 有两个重要改进。 首先,现在可以调试集成矢量化和数据分块工作负载。 其次,调试会话经过了重新设计,使技能和映射的呈现更简化。 可以选择流中的一个对象,在侧面板中查看或编辑其详细信息。 以前使用的选项卡式布局完全替换为页面上的更多上下文敏感信息。
8 月 API 2024-07-01. REST API 的稳定版正式发布,支持矢量数据类型、矢量压缩以及在索引编制和查询期间的集成矢量化。
8 月 功能 集成向量化,宣布正式发布。 在索引期间进行技能驱动的分块和嵌入。
8 月 功能 Vectorizers。 宣布正式发布。 在查询执行期间进行文本到矢量转换。 Azure OpenAI 矢量器自定义 Web API 矢量器都已正式发布。
8 月 功能 AzureOpenAIEmbedding 技能。 宣布正式发布。 一种技能类型,可在索引编制期间调用 Azure OpenAI 嵌入模型来生成嵌入项。
8 月 功能 索引投影。 宣布正式发布。 技能组定义的一个组件,用于定义辅助索引的形状。支持一对多索引模式,其中,来自扩充管道的内容可以针对多个索引。
8 月 功能 二进制和标量量化。 宣布正式发布。 使用内置量化压缩内存和磁盘上的矢量索引大小。
8 月 功能 导入和矢量化数据向导。 宣布正式发布。 可创建包括数据分块和矢量化的完整索引管道的向导。 该向导可创建所有必要的对象和配置。 此版本添加了对 Azure 存储中的 Azure Data Lake 的向导支持。
8 月 功能 存储属性。 宣布正式发布。 布尔值,通过不存储可检索矢量来减少矢量索引的存储。
8 月 功能 vectorQueries.Weight 属性。 宣布正式发布。 在搜索操作中指定每个矢量查询的相对权重。
7 月 加速器 与数据聊天。 在 Azure 中运行的 RAG 模式的解决方案加速器,使用 Azure AI 搜索进行检索,并使用 Azure OpenAI 大型语言模型来创建对话式搜索体验。 带有示例数据的代码可用于财务顾问、合同审查和汇总等用例场景。
7 月 加速器 对话知识挖掘。 基于 Azure AI 搜索、Azure 语音和 Azure OpenAI 构建的解决方案加速器,使客户能够从联系后中心对话中提取可作的见解。
7 月 加速器 生成你自己的 Copilot。 创建自己的自定义 Copilot 解决方案,使客户顾问能够在结构化和非结构化数据中利用生成 AI 的强大功能。 帮助客户优化日常任务,与更多客户建立更好的互动。
5 月 服务限制 每个层更高的容量和更多的矢量配额(相同的计费费率)。 对于大多数区域,2024 年 4 月 3 日之后创建的服务的标准 2 (S2)、标准 3 (S3) 和标准 3 高密度 (S3 HD) 现在可以使用更大的分区大小。 要获取更大的分区,请在提供较新的基础结构的区域中创建新服务

存储优化层(L1 和 L2)也有了更多容量。 L1 和 L2 客户必须创建新的服务,才能受益于更高的容量。 目前未提供就地升级。

额外容量现已在更多区域提供:德国北部、德国中西部、南非北部、瑞士西部,以及世纪互联运营的 Azure(得克萨斯州、亚利桑那州和弗吉尼亚州)。
5 月 功能 矢量相关性
混合查询相关性。 四项增强功能可提高矢量和混合搜索相关性。

首先,现在可以对矢量搜索结果设置阈值,排除低评分结果。

其次,查询体系结构中的更改在每个查询类型的查询管道末尾应用计分配置文件。 文档提升是一个常见的计分概要文件,现在它在矢量和混合查询上按预期工作。

第三,可以在混合查询中设置 MaxTextRecallSizecountAndFacetMode,以控制流入混合排名模型的 BM25 排名搜索结果的数量。

第四,对于矢量和混合搜索,可以加权矢量查询,以便在多查询请求中提升或降低其重要性。
5 月 功能 二进制向量支持Collection(Edm.Byte) 是新的受支持的数据类型。 此数据类型将打开与 Cohere v3 二进制嵌入模型 和自定义二进制量化的集成。 缩小数据类型可降低大型矢量数据集的成本。 有关详细信息,请参阅编制二进制数据索引以进行矢量搜索
5 月 技能 Azure AI 视觉多模式嵌入技能(预览版)。 绑定到 Azure AI 视觉的多模式嵌入 API 的新技能。 可以在编制索引期间为文本或图像生成嵌入。 此技能可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。
5 月 矢量化器 Azure AI 视觉矢量化器(预览版)。 新的矢量化器使用 多模式嵌入 API 连接到 Azure AI 视觉资源,以在查询时生成嵌入。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。
5 月 矢量化器 Azure AI Foundry 模型目录矢量化器(预览版)。 新的矢量化器可连接到从 Azure AI Foundry 模型目录部署的嵌入模型。 此矢量化器可通过 Azure 门户和 2024-05-01 预览版 REST API 获取。

如何使用 Azure AI Foundry 中的模型实现集成的矢量化
5 月 技能 AzureOpenAIEmbedding 技能(预览版)支持 Azure OpenAI 上的更多模型。 现在支持 text-embedding-3-large 和 text-embedding-3-small,以及上一次更新中的 text-embedding-ada-002。 通过新的 dimensionsmodelName 属性,可以在 Azure OpenAI 上指定各种嵌入模型。 以前,维度限制固定在 1,536 个维度,仅适用于 text-embedding-ada-002。 更新的技能可通过 Azure 门户和 2024-05-01-preview REST API 获取。
5 月 API Azure SDK beta 包。 查看以下 Azure SDK beta 版包的更改日志,以获取新功能支持:适用于 Python 的 Azure SDK适用于 .NET 的 Azure SDK适用于 Java 的 Azure SDK
4 月 API 解决信息泄露的安全更新。 GET 响应不再返回连接字符串或密钥。 适用于 GET 技能组、GET 索引和 GET 索引器。 此更改有助于保护与 AI 搜索集成的 Azure 资产免受未经授权的访问。
4 月 API 2024-03-01-preview 搜索 REST API
4 月 API 2024-03-01-preview 管理 REST API
4 月 API 2023-07-01-preview 弃用公告。 自 2024 年 7 月 8 日起,不再支持此版本。 较新的 API 版本具有不同的矢量配置。 请尽快迁移到较新版本
4 月 服务限制 基本层和标准层 以相同的每分区计费费率为每个分区提供更多存储。 额外的容量受区域可用性影响,适用于 2024 年 4 月 3 日之后新建的搜索服务。 基本层现在最多支持三个分区和三个副本。
4 月 服务限制 在所选区域 2024 年 4 月 3 日之后创建的新服务上,矢量配额更高
4 月 功能 矢量量化、窄向量数据类型和新stored属性(预览版)。 这三个功能共同降低了存储和成本。
2 月 功能 矢量字段的新维度限制。 最大维度限制现在提升到3072,而之前为2048

上一年的公告

服务品牌重塑

多年来,此服务有多个名称。 此处为逆时序顺序排列这些名称:

  • Azure AI 搜索(2023 年 11 月)已重命名,以符合 Azure AI 服务和客户预期。
  • Azure 认知搜索(2019 年 10 月)已重命名,以反映认知技能和 AI 处理在服务操作中更广泛的用途(但仍为可选)。
  • Azure 搜索(2015 年 3 月)原始名称。

服务更新

可以在 Azure 网站上找到 Azure AI 搜索 的服务更新公告

功能重命名

2023 年 11 月,语义搜索已更名为语义排序器,以更好地描述现有结果集 L2 排序的功能。