选择 Azure AI 搜索的服务层

创建搜索服务的一部分即选择定价层(或 SKU),该定价层(或 SKU)在服务的生存期内是固定的。 创建服务时,在门户中的“选择定价层”页面中指定层级。 在 PowerShell 或 Azure CLI 中,层级是通过 -Sku 参数指定的。

层级确定了:

  • 服务上允许的最大索引数和其他对象数
  • 分区(物理存储)的大小和速度
  • 按计费费率计费,每月成本是固定的,但在添加容量的情况下成本会增加

在一些实例中,选择的层级决定了高级版功能的可用性。

计费费率显示在门户的“选择定价层”页中。 可以查看区域费率定价页,并查看计划和管理成本,了解有关计费模型的详细信息。

注意

2024 年 4 月 3 日之后创建的搜索服务在几乎每个层级都具有更大的分区和更高的矢量配额。 有关详细信息,请参阅服务限制

层级说明

层级包括“免费”、“基本”、“标准”和“存储优化”。 “标准”和“存储优化”提供多种配置和容量。 以下 Azure 门户屏幕截图显示了可用的层,其中不包括定价层(可在门户中和定价页上找到该层)。

定价图

免费”层可用于为较小的项目(例如,运行教程和代码示例)创建有限的搜索服务。 在内部,系统资源会在多个订阅服务器之间共享。 无法缩放免费服务,无法运行大量工作负载,而且某些高级功能不可用。 每个 Azure 订阅只能拥有一项免费的搜索服务。

最常用的计费层包括:

  • “基本层”能够通过支持三个副本来满足 SLA。

  • 标准层(S1、S2、S3)是默认值。 它使你能够更灵活地缩放工作负荷。 你可以缩放分区和副本。 使用受你控制的专用资源,你可以部署较大的项目,优化性能并增大容量。

有些层级是为某些类型的工作而设计的:

  • “标准 3 高密度(S3 HD)”是 S3 的托管模式,其中的底层硬件已针对大量的较小索引进行优化,适用于多租户方案。 S3 HD 的每单位费用与 S3 相同,但硬件经过优化,可基于大量的小型索引快速读取文件。

  • 与“标准”层相比,“存储优化(L1、L2)”层以更低的每 TB 价格提供更大的存储容量。 这些层级专为不经常更改的大型索引而设计。 主要弊端是查询延迟更高,应根据具体的应用程序要求确认这种延迟。

预配服务时,可以在定价页上、Azure AI 搜索中的服务限制一文中以及门户页上找到有关各个层的详细信息。

按层划分的功能可用性

大多数功能在所有层级(包括免费层)都可用。 在少数情况下,层决定了功能的可用性。 下表描述了相关约束。

功能 限制
索引器 索引器在 S3 HD 上不可用。 索引器对免费层有更多限制
AI 扩充 在免费层上运行,但不建议这样做。
用于出站(索引器)访问的托管或受信任标识 在免费层上不可用。
客户托管的加密密钥 在免费层上不可用。
IP 防火墙访问 在免费层上不可用。
专用终结点(与 Azure 专用链接集成) 对于到搜索服务的入站连接,在免费层上不可用。
对于通过索引器连接到其他 Azure 资源的出站连接,在免费层或 S3 HD 上不可用。
对于使用技能组的索引器,在免费层、基本层、S1 或 S3 HD 上不可用。
可用性区域 在免费层或基本层上不可用。

资源密集型功能可能无法正常运行,除非你为其提供足够的容量。 例如,AI 扩充包含长时间运行的技能,除非数据集较小,否则这些技能在免费服务中会超时。

上限

层级决定服务本身的最大存储,以及可创建的索引、索引器、数据源、技能组和同义词映射的最大数量。 如需详细了解所有限制,请参阅 Azure AI 搜索中的服务限制

分区大小和速度

层定价包括关于每分区存储的详细信息,范围从基本层 15 GB 到存储优化 (L2) 层 2 TB 不等。 未发布其他硬件特性(如操作速度、延迟和传输率),但在具有支持这些方案的功能的硬件上构建了设计用于特定解决方案体系结构的层级。 有关分区的详细信息,请参阅估计和管理容量Azure AI 搜索的可靠性

注意

从 2024 年 4 月开始,将在选定区域推出更高容量的分区。 于 2024 年 5 月发布的第二波更高容量的分区。 如果使用的是较旧的搜索服务,请考虑新建搜索服务,以便以相同的计费费率享受更多容量。 有关详细信息,请阅读服务限制

计费费率

不同层级的计费费率也不同,层级所在的硬件越昂贵,或者提供的功能越昂贵,费率就越高。 可在 Azure AI 搜索的 Azure 定价页面中查看层级计费费率。

创建服务后,计费费率将成为 24 小时运行服务的固定成本,如果选择添加更多容量,则会产生增量成本 。

搜索服务以分区(用于存储)和副本(查询引擎实例)的形式分配计算资源 。 最初,使用其中一种资源创建服务,并且计费费率包含这两种资源。 但是,如果缩放容量,则成本会以计费费率的增量增加或减少。

下面的示例进行了这方面的演示。 假定每月的计费费率为 100 美元。 如果将搜索服务的初始容量保持在一个分区和一个副本,则月底你可能需要支付 100 美元的费用。 但是,如果添加两个副本来获得高可用性,则每月费用将增加到 300 美元(第一个副本分区对的费用为 100 美元,后两个副本的费用为 200 美元)。

此计费模型基于将计费费率应用到搜索服务使用的数字搜索单位 (SU) 的概念。 所有服务最初预配在一个 SU 上,但可通过添加分区或副本来处理更大的工作负荷,从而增加 SU。 有关详细信息,请参阅如何估计搜索服务的成本

升级或降级层

没有对升级或降级层的内置支持。 如果要切换到其他层,方法如下:

  • 在新层创建新的搜索服务。

  • 将搜索内容部署到新服务上。 按照此清单操作,以确保拥有所有内容。

  • 确定不再需要旧搜索服务后,请将其删除。

对于不想从头开始重新生成的大型索引,请考虑使用备份和还原示例来移动它们。

后续步骤

选择定价层的最佳方法是从最低成本层级开始,然后通过体验和测试来决定是保留服务还是在更高层级创建新服务。 在接下来的步骤中,建议你在一个层级上创建一个搜索服务(该层级可适应你打算进行的测试级别),然后查看以下指南,获得关于估计成本和容量的建议。