Q: 什么是Azure AI 搜索？

Azure AI 搜索为代理、全文和矢量搜索方案提供可搜索内容的专用搜索引擎和持久存储。 它还包括可选的集成 AI，用于从原始内容中提取文本和结构，以及为矢量搜索分块和向量化内容。

Q: 如何使用 Azure AI 搜索？

主要工作流是创建、加载和查询索引。 尽管可以将Azure门户用于大多数任务，但Azure AI 搜索旨在以编程方式使用，处理来自客户端代码的请求。 编程支持通过.NET、Python、Java和 JavaScript SDK 中的 REST API 和客户端库提供，用于Azure。

Q: “Azure搜索”、“Azure 认知搜索”和“Azure AI 搜索”是否是同一产品？

是的。 它们都是同一产品，品牌在2019年10月重新命名，并在2023年10月再次重新命名。 有时，你可能会在编程级别看到前名称的证据。

Q: 如何将搜索集成到解决方案中？

客户端代码应调用Azure SDK客户端库或 REST API 以连接到搜索索引、构建查询和处理响应。 还可以编写代码来生成和刷新索引，或者以编程方式或通过脚本运行索引器。

Q: 是否可以暂停服务并停止计费？

不能暂停搜索服务。 在Azure AI 搜索中，创建服务时会分配计算资源。 无法按需释放和回收这些资源。

Q: 是否可以升级或降级服务？

不支持降级服务。 若要获取更多或更少的容量，还可以 切换到其他定价层 。 如果当前服务配置超出 目标层的限制 ，或者你的区域 对目标层具有容量限制， 则会阻止缩放。 目前，您只能在基本和标准（S1、S2 和 S3）层之间切换。

Q: 如果将搜索服务迁移到另一个订阅或资源组，是否会出现停机？

只要遵循 移动资源前需查看的清单 ，并确保每个步骤都已完成，就不会出现停机。

Q: Azure AI 搜索“索引”的含义是什么？

它是指将用于填充搜索索引的文本内容和令牌进行引入、解析和存储。 编制索引会创建倒排索引以及支持信息检索的其他物理数据结构。 如果架构包括矢量字段，它会创建矢量索引。

Question 1

什么是Azure AI 搜索？

Accepted Answer

Azure AI 搜索为代理、全文和矢量搜索方案提供可搜索内容的专用搜索引擎和持久存储。它还包括可选的集成 AI，用于从原始内容中提取文本和结构，以及为矢量搜索分块和向量化内容。

Question 2

如何使用 Azure AI 搜索？

Accepted Answer

主要工作流是创建、加载和查询索引。尽管可以将Azure门户用于大多数任务，但Azure AI 搜索旨在以编程方式使用，处理来自客户端代码的请求。编程支持通过.NET、Python、Java和 JavaScript SDK 中的 REST API 和客户端库提供，用于Azure。

Question 3

“Azure搜索”、“Azure 认知搜索”和“Azure AI 搜索”是否是同一产品？

Accepted Answer

是的。它们都是同一产品，品牌在2019年10月重新命名，并在2023年10月再次重新命名。有时，你可能会在编程级别看到前名称的证据。

Question 4

支持哪些语言？

Accepted Answer

对于矢量，使用的嵌入模型决定了语言体验。

对于非函数字符串和数字，用于标记化的默认分析器是标准 Lucene，这是与语言无关的。另外，语言支持通过语言分析器将语言规则应用于入站（索引）和出站（查询）内容来表示。某些功能（如拼写器和查询改写）仅限于一部分语言。

Question 5

如何将搜索集成到解决方案中？

Accepted Answer

客户端代码应调用Azure SDK客户端库或 REST API 以连接到搜索索引、构建查询和处理响应。还可以编写代码来生成和刷新索引，或者以编程方式或通过脚本运行索引器。

Question 6

是否可以暂停服务并停止计费？

Accepted Answer

不能暂停搜索服务。在Azure AI 搜索中，创建服务时会分配计算资源。无法按需释放和回收这些资源。

Question 7

是否可以升级或降级服务？

Accepted Answer

不支持降级服务。

若要获取更多或更少的容量，还可以切换到其他定价层。如果当前服务配置超出目标层的限制，或者你的区域对目标层具有容量限制，则会阻止缩放。目前，您只能在基本和标准（S1、S2 和 S3）层之间切换。

Question 8

是否可以重命名或移动服务？

Accepted Answer

服务名称和区域在服务的生存期内是固定的。

Question 9

如果将搜索服务迁移到另一个订阅或资源组，是否会出现停机？

Accepted Answer

只要遵循移动资源前需查看的清单，并确保每个步骤都已完成，就不会出现停机。

Question 10

Azure AI 搜索“索引”的含义是什么？

Accepted Answer

它是指将用于填充搜索索引的文本内容和令牌进行引入、解析和存储。编制索引会创建倒排索引以及支持信息检索的其他物理数据结构。

如果架构包括矢量字段，它会创建矢量索引。

Question 11

是否可以移动、备份和还原索引？

Accepted Answer

不支持原生方式移植索引。搜索索引被视为下游数据结构，接受来自收集操作数据的其他数据源的内容。因此，系统本身不支持备份和还原索引。预期是在索引被删除或需要迁移时，您应该从源数据中重新生成索引。

但是，如果要在搜索服务之间移动索引，可以尝试针对 .NET 或 Python 备份和还原代码示例。

Question 12

删除索引或服务后，是否可以还原索引或服务？

Accepted Answer

否。如果删除Azure AI 搜索索引或服务，则无法恢复。删除搜索服务时，会永久删除服务中的所有索引。

Question 13

是否可以从 SQL 数据库副本中编制索引？

Accepted Answer

在使用搜索索引器进行 Azure SQL 数据库的索引处理时，从头开始建立索引时，可以不受限制地使用主要或次要副本作为数据源。然而，使用增量更新（基于已更改的记录）刷新索引时需要主副本。此需求来自于 SQL 数据库，它仅确保主要副本上的更改跟踪。如果尝试为索引刷新工作负荷使用次要副本，则无法保证获得所有数据。

Question 14

什么是矢量搜索？

Accepted Answer

矢量搜索是一种通过比较其矢量表示形式来查找最相似的文档的技术。由于矢量表示形式的目标是以数字格式捕获项的基本特征，因此矢量查询可以识别类似的内容，即使没有基于关键字或标记的显式匹配项。

当用户执行搜索时，查询汇总为矢量表示形式，矢量搜索引擎标识最相似的文档。为了提高大型数据库的效率，矢量搜索通常为查询向量提供近似近邻（ANN）。有关详细信息，请参阅 Azure AI 搜索中的 Vector 搜索。

Question 15

Azure AI 搜索是否支持矢量搜索？

Accepted Answer

Azure AI 搜索支持矢量索引和检索。如果使用集成矢量化，则可以对查询字符串和内容进行分块和向量化，这依赖于索引器和技能集。

Question 16

矢量搜索如何在Azure AI 搜索中工作？

Accepted Answer

借助独立矢量搜索，首先使用嵌入模型将内容转换为嵌入空间中的矢量表示形式。然后，可以在文档有效负载中向搜索索引提供这些矢量以编制索引。若要提供搜索请求，请使用同一个嵌入模型将搜索查询转换为矢量表示形式，矢量搜索会查找最相似的矢量并返回相应的文档。

在 Azure AI 搜索中，您可以将矢量数据与文本及其他类型的内容一起作为文档中的字段进行索引。矢量字段有多个数据类型。

矢量查询可以单独发出，也可以与其他查询类型（包括同一个搜索请求中的词条查询和筛选器）结合发出。

Question 17

是否可以Azure AI 搜索向量化内容或查询？

Accepted Answer

内置集成矢量化现已正式发布。

Question 18

我的搜索服务是否支持矢量搜索？

Accepted Answer

大多数现有服务都支持矢量搜索。如果使用支持矢量搜索和索引创建的包或 API 失败，则基础搜索服务不支持矢量搜索，并且必须创建一个新服务。对于在 2019 年 1 月 1 日之前创建的一小部分服务，可能会发生这种情况。

Question 19

是否可以向现有索引添加矢量搜索？

Accepted Answer

如果搜索服务支持矢量搜索，则现有索引和新索引都可以容纳矢量字段。

Question 20

为什么在新搜索服务和现有搜索服务之间看到不同的矢量索引大小限制？

Accepted Answer

Azure AI 搜索为新的搜索服务推出了改进的矢量索引大小限制，但部分区域遇到容量限制，某些区域没有所需的基础结构。在受支持区域 2024 年 5 月之后创建的新搜索服务应会看到矢量索引大小限制增加。

Question 21

为什么矢量索引显示零存储？

Accepted Answer

只有使用分层导航小型世界（HNSW）算法的矢量索引会在 Azure 门户中报告矢量索引的大小。如果索引使用穷举 KNN，即使索引包含矢量，矢量索引大小也会报告为零。

Question 22

如何在搜索索引上启用矢量搜索？

Accepted Answer

若要在索引中启用矢量搜索，请执行：

向字段集合中添加一个或多个矢量字段。
将“vectorSearch”部分添加到索引架构，指定矢量搜索字段所使用的配置，包括所使用的 ANN 算法的参数，如 HNSW。
使用最新的稳定 REST API 版本或Azure SDK创建或更新索引、加载文档和发出查询。有关详细信息，请参阅创建矢量索引。

Question 23

查询执行在哪里进行？

Accepted Answer

查询在搜索服务上托管的单个搜索索引上执行。不能将多个索引联接到两个或多个索引中搜索内容，但可以在多个搜索服务中查询同名索引。

Question 24

为什么我知道有效的术语没有匹配项？

Accepted Answer

最常见的情况是不了解每种查询类型支持不同的搜索行为和语言分析级别。全文搜索是主要工作负荷，包含一个语言分析过程，用于将术语分解为词根形式。查询分析的这种特性拓宽了可能的匹配范围，因为标记化的术语能够匹配更多变体。

但是，通配符、模糊和正则表达式查询不会像常规术语或短语查询一样进行分析，如果查询与搜索索引中单词的分析形式不匹配，可能会导致召回率不佳。有关查询解析和分析的详细信息，请参阅 Azure AI 搜索中的 Full-text 搜索。

Question 25

为什么我的通配符搜索速度这么慢？

Accepted Answer

大多数通配符搜索查询（如前缀、模糊和正则表达式）在内部使用搜索索引中的匹配词进行重写。这种额外的处理会增加延迟。此外，可能会用许多字词重写广泛的搜索查询 a* ，这可能会很慢。对于高性能通配符搜索，请考虑定义自定义分析器。

Question 26

能否跨多个索引进行搜索？

Accepted Answer

否。查询始终限定为单个索引。

Question 27

为什么每个匹配项的搜索分数都为恒定的 1.0？

Accepted Answer

根据匹配词的统计属性为全文搜索查询生成搜索分数，结果集中的排序顺序从高到低。不是全文搜索（通配符、前缀、正则表达式）的查询类型不会按相关性分数进行排名。常量分数允许通过查询扩展找到的匹配项包含在结果中，而不会影响排名。

例如，假设在通配符搜索中输入“tour*”，将匹配“tours”、“tourettes”和“tourmaline”这几个结果。由于这些结果的性质，我们无法合理推断出哪些字词的相关性高于其他字词。因此，在为通配符、前缀和正则表达式类型的查询结果评分时，会忽略字词频率。基于不完整输入的搜索结果会被赋予一个常数分数，以避免偏向于可能意外的匹配。

Question 28

Azure AI 搜索存储客户数据的位置？

Accepted Answer

它将数据存储在部署服务的地理区域（Geo）。 Azure可能会在同一地理位置复制数据以实现高可用性和持久性。有关详细信息，请参阅 Azure 中的数据驻留。

Question 29

Azure AI 搜索是否将客户数据发送到其他服务进行处理？

Accepted Answer

是的。技能和向量化器从 Azure AI 搜索发起传出调用，传输到你为嵌入或聊天指定的其他 Azure 资源或外部模型。对这些 API 的调用通常包含要处理的原始内容或由嵌入模型向量化的查询。对于Azure到Azure连接，服务通过内部网络发送请求。如果添加自定义技能或矢量化器，索引器会通过公共网络将内容发送到自定义技能中提供的 URI，除非你配置共享专用链接。

Question 30

Azure AI 搜索处理其他区域中的客户数据吗？

Accepted Answer

处理（矢量化或应用的 AI 转换）在托管技能使用的 Azure AI 服务子服务、托管自定义技能的 Azure 应用或函数，或托管已部署模型的 Azure AI 服务或 Azure AI 服务地理区域中执行。这些资源由您指定，所以您可以选择是否在与您的搜索服务相同的地理区域部署它们。

如果将数据发送到外部（非Azure）模型或服务，则处理位置由外部服务确定。

Question 31

是否可以根据用户标识控制对搜索结果的访问？

Accepted Answer

如果实现将文档与用户标识关联的解决方案，则可以。通常，有权运行应用程序的用户也有权查看所有搜索结果。 Azure AI 搜索没有对行级别或文档级权限的内置支持，但你可以实现安全筛选器作为解决方法。有关步骤和脚本，请参阅 Get started: Chat using your own data (Python sample)。

Question 32

是否可以根据用户标识控制对操作的访问？

Accepted Answer

是的。可以将基于角色的授权应用于内容的数据平面操作。

Question 33

如果我的搜索服务位于 IP 防火墙或专用终结点后面，是否可以使用 Azure 门户查看和管理搜索内容？

Accepted Answer

如果创建允许客户端和门户访问的网络异常，则可以在受网络保护的搜索服务上使用 Azure 门户。有关详细信息，请参阅通过 IP 防火墙进行连接或通过专用终结点进行连接。

常规

什么是Azure AI 搜索？

如何使用 Azure AI 搜索？

“Azure搜索”、“Azure 认知搜索”和“Azure AI 搜索”是否是同一产品？

支持哪些语言？

如何将搜索集成到解决方案中？

是否可以暂停服务并停止计费？

是否可以升级或降级服务？

是否可以重命名或移动服务？

如果将搜索服务迁移到另一个订阅或资源组，是否会出现停机？

索引

Azure AI 搜索“索引”的含义是什么？

是否可以移动、备份和还原索引？

删除索引或服务后，是否可以还原索引或服务？

是否可以从 SQL 数据库副本中编制索引？

矢量

什么是矢量搜索？

Azure AI 搜索是否支持矢量搜索？

矢量搜索如何在Azure AI 搜索中工作？

是否可以Azure AI 搜索向量化内容或查询？

我的搜索服务是否支持矢量搜索？

是否可以向现有索引添加矢量搜索？

为什么在新搜索服务和现有搜索服务之间看到不同的矢量索引大小限制？

为什么矢量索引显示零存储？

如何在搜索索引上启用矢量搜索？

查询

查询执行在哪里进行？

为什么我知道有效的术语没有匹配项？

为什么我的通配符搜索速度这么慢？

能否跨多个索引进行搜索？

为什么每个匹配项的搜索分数都为恒定的 1.0？

安全性

Azure AI 搜索存储客户数据的位置？

Azure AI 搜索是否将客户数据发送到其他服务进行处理？

Azure AI 搜索处理其他区域中的客户数据吗？

是否可以根据用户标识控制对搜索结果的访问？

是否可以根据用户标识控制对操作的访问？

如果我的搜索服务位于 IP 防火墙或专用终结点后面，是否可以使用 Azure 门户查看和管理搜索内容？

后续步骤

Azure AI 搜索常见问题

常规

什么是Azure AI 搜索？

如何使用 Azure AI 搜索？

“Azure搜索”、“Azure 认知搜索”和“Azure AI 搜索”是否是同一产品？

支持哪些语言？

如何将搜索集成到解决方案中？

是否可以暂停服务并停止计费？

是否可以升级或降级服务？

是否可以重命名或移动服务？

如果将搜索服务迁移到另一个订阅或资源组，是否会出现停机？

索引

Azure AI 搜索“索引”的含义是什么？

是否可以移动、备份和还原索引？

删除索引或服务后，是否可以还原索引或服务？

是否可以从 SQL 数据库副本中编制索引？

矢量

什么是矢量搜索？

Azure AI 搜索是否支持矢量搜索？

矢量搜索如何在Azure AI 搜索中工作？

是否可以Azure AI 搜索向量化内容或查询？

我的搜索服务是否支持矢量搜索？

是否可以向现有索引添加矢量搜索？

为什么在新搜索服务和现有搜索服务之间看到不同的矢量索引大小限制？

为什么矢量索引显示零存储？

如何在搜索索引上启用矢量搜索？

查询

查询执行在哪里进行？

为什么我知道有效的术语没有匹配项？

为什么我的通配符搜索速度这么慢？

能否跨多个索引进行搜索？

为什么每个匹配项的搜索分数都为恒定的 1.0？

安全性

Azure AI 搜索存储客户数据的位置？

Azure AI 搜索是否将客户数据发送到其他服务进行处理？

Azure AI 搜索处理其他区域中的客户数据吗？

是否可以根据用户标识控制对搜索结果的访问？

是否可以根据用户标识控制对操作的访问？

如果我的搜索服务位于 IP 防火墙或专用终结点后面，是否可以使用 Azure 门户查看和管理搜索内容？

后续步骤

其他资源