本文介绍如何对 Azure AI 搜索进行计费,包括固定成本和可变成本,并提供成本管理指南。
在创建搜索服务之前,请使用 Azure 定价计算器 根据计划 容量 和功能估算成本。 另一个资源是容量规划工作表,用于为预期的索引大小、索引吞吐量和索引成本建模。
随着搜索工作负载的发展,请按照我们的提示在部署和运营期间最大限度地降低成本。 还可以使用内置指标来监视查询请求和 成本管理 ,以创建预算、警报和数据导出。
注意
在 2024 年 4 月或 5 月之后创建的服务上,可用具有更高容量的分区,且计费费率相同。 有关分区大小升级的详细信息,请参阅 服务限制。
了解计费模型
Azure AI 搜索具有固定和标准预付费套餐计费。 只要搜索服务存在,您就会支付固定费率,而高级功能会根据您的使用情况计费。
Azure AI 搜索的成本只是 Azure 帐单中每月成本的一部分。 尽管本文重点介绍如何规划和管理 Azure AI 搜索成本,但需针对 Azure 订阅中使用的所有 Azure 服务和资源(包括非Microsoft服务)付费。
如何为基本服务付费
创建或使用搜索资源时,您需要按您的定价层的按比例小时费率,支付所需的最小副本和分区组合(R × P)的费用。 当搜索单位增加或减少时,成本也相应增加或减少。 有关详细信息和计费模型示例,请参阅 计费费率。
如何为高级功能付费
除了搜索服务的基本成本外,还会收取高级功能费用。 下表列出了高级功能及其计费单位。 所有这些功能都是可选的,因此如果不使用这些功能,则不会产生任何费用。
| 功能 / 特点 | 计费单位 | 
|---|---|
| 图像提取 (AI 扩充) 1 | 每 1000 张图片。 请参阅定价页。 | 
| 自定义实体查找技能 (AI 扩充) | 每 1000 条文本记录。 请参阅定价页 | 
| 内置或自定义技能 (AI 扩充) 2 | 交易数量。 费率由模型提供者决定:Azure AI 服务、Azure OpenAI 或 Azure AI Foundry。 | 
| Vectorizers2 | 矢量化操作的数量。 按模型提供商的费率计费:Azure AI 视觉、Azure OpenAI 或 Azure AI Foundry。 | 
| 语义排序器 | queryType=semantic的查询次数。 按渐进率计费。 请参阅定价页。 | 
| 共享专用链接 | 只要共享专用链接存在并使用,带宽计费。 | 
              1 引用从索引器管道中的文件中提取的图像。 文本提取是免费的。 
              启用indexAction参数或调用文档提取技能时,将按图像提取计费。
2 Azure OpenAI 模型和 Azure AI Foundry 模型的费用会显示在这些服务的帐单上。
其他收费方式
根据配置和使用情况,可能会收取以下费用:
- 数据流量可能会产生网络成本。 请参阅 带宽定价。 
- 多种高级功能(例如 知识存储、 调试会话和 扩充缓存)取决于 Azure 存储并产生存储成本。 这些功能的费用显示在 Azure 存储帐单上。 
- 客户管理的密钥(提供敏感内容的双重加密)需要计费的 Azure Key Vault。 
- 技能集可以包括 可计费的内置技能、不可计费的内置实用工具技能和自定义技能。 不可计费的实用工具技能包括 条件、 整形程序、 文本合并和 文本拆分。 它们没有 API 密钥要求或 20 个文档限制。 
- 自定义技能是你提供的功能。 自定义技能仅在调用其他计费服务时才计费。 它们没有 API 密钥要求或 20 个文档限制。 
注意
对于处理的全文查询、矢量查询、查询响应或文档数量,你不会被收费。 但是, 服务限制 适用于每个定价层。
估算和计划成本
使用 Azure 定价计算器 估算 Azure AI 搜索的基线成本。 还可以在创建服务期间在 “选择定价层 ”页上找到估计的成本和层比较。
对于初始测试,建议创建容量规划工作表。 工作表可帮助你了解索引与源比率以及扩充或向量功能对容量和成本的影响。
若要创建容量规划工作表,请按照以下步骤执行。
- 为数据的小型示例(1-5%)编制索引。 包括计划使用的任何 OCR、扩充或嵌入技能。 
- 测量索引大小、索引吞吐量和索引成本。 
- 请根据结果推断来估算您的数据的整体需求。 
最小化成本
若要最大程度地降低 Azure AI 搜索解决方案的成本,请使用以下策略:
部署和配置
- 在 每个分区具有更多存储的区域中创建搜索服务。 
- 在同一区域(或尽可能少的区域)中创建所有相关的 Azure 资源,以最大程度地减少或消除带宽费用。 
- 选择最轻的 定价层 来满足你的需求。 Basic和S1以最低的每小时收费标准为每个SU提供对现代API的完整访问权限。 
- 使用适用于前端应用程序的 Azure Web 应用 在数据中心边界内保留请求和响应。 
规模化
- 仅当索引大小或引入吞吐量需要分区时,才添加分区。 
- 仅当每秒查询增加、复杂查询限制服务或需要高可用性时,才添加副本。 
- 针对资源密集型操作(例如索引)扩展规模,然后针对常规查询工作负荷进行向下调整。 
- 编写代码以自动扩展应对可预测的工作负载模式。 
- 请记住,容量和定价不是线性的。 在同一层上容量翻倍会导致成本增加超过两倍。 若要以类似的价格获得更好的性能,请考虑 切换到更高的层。 
索引和扩充
监视成本
在服务层面,可以监视每秒查询的内置指标(QPS)、搜索延迟、限流查询和索引大小。 然后,可以 创建一个 Azure Monitor 仪表板 ,用于覆盖 QPS、延迟和成本数据,以确定何时添加或删除副本。
在订阅或资源组级别, 成本管理功能 提供了用于跟踪、分析和控制成本的工具。 可以使用成本管理来:
- 创建预算,用于定义和跟踪支出限制的进度。 若要进行更精细的监视,请使用特定 Azure 资源或服务的 筛选器 自定义预算。 筛选器可防止意外创建产生额外费用的资源。 
- 创建警报 ,自动通知利益干系人支出异常或超支风险。 警报是根据支出与预算和成本阈值的比较而生成的。 为订阅和资源组创建预算和警报,使它们可用于监视总体成本。 
- 将成本数据导出 到存储帐户。 当你或其他人需要执行更多成本分析时,这非常有用。 例如,财务团队可以使用 Excel 或 Power BI 来分析数据。 可以按每天、每周或每月计划导出成本,并设置自定义的日期范围。 导出成本数据是检索成本数据集的建议方法。 
FAQ
是否可以暂时关闭搜索服务以节省成本?
搜索是作为持续性服务运行的。 专用资源始终正常运行,并在服务期间专用于您的独占使用。 若要完全停止计费,必须删除该服务。 删除服务这项操作是永久性的,也会删除其关联的数据。
是否可以更改现有搜索服务的计费费率(层级)?
现有服务可以在基本层和标准层(S1、S2 和 S3)之间切换。 当前服务配置不能超出目标层的限制,并且区域在目标层上不能有容量约束。 有关详细信息,请参阅更改定价层。