将 Azure AI 多服务资源附加到 Azure AI 搜索中的技能组

在 Azure AI 搜索中配置可选的 AI 扩充管道时,可以免费扩充少量文档,每个索引每天最多 20 个事务。 对于更大、更频繁的工作负荷,应附加可计费的 Azure AI 多服务资源

多服务帐户提供 Azure AI 服务的集合,而不是单个服务。 该帐户具有关联的资源密钥。 此密钥在 Azure AI 搜索技能组中指定,并允许 Azure 向你收取使用这些服务的费用:

该密钥用于计费,而非用于连接。 即使你在连接上使用其他机制(例如角色分配和托管标识)时,也必须在技能集中提供密钥。

提示

Azure 提供用于监视计费和预算的基础结构。 有关监视 Azure AI 服务的详细信息,请参阅计划和管理 Azure AI 服务的成本

获取 Azure AI 多服务帐户的资源密钥

  1. 登录到 Azure 门户

  2. 在搜索服务所在的同一区域中创建 Azure AI 多服务资源

  3. 从“资源”>“密钥和终结点”页获取资源密钥。

将资源密钥添加到技能集

可以使用 Azure 门户、REST API 或 Azure SDK 将密钥添加到技能集。

如果未指定该属性,搜索服务会尝试使用索引器每天可用的免费扩充量。 每个索引器调用执行 20 个事务后会停止执行计费技能,索引器执行历史记录中会显示“超时”消息。

向技能组定义添加密钥:

  • 如果使用导入数据向导,请创建或选择 Azure AI 帐户。 该向导会将资源密钥添加到技能集定义。

  • 对于新的或现有的技能集,请提供技能集定义中的密钥。

    密钥页的屏幕截图。

删除密钥

扩充是收费操作。 如果不再需要调用 Azure AI 服务,请按照这些说明移除多服务密钥并阻止使用外部资源。 如果没有密钥,技能组会还原为每天为每个索引器默认分配 20 个免费事务。 在达到 20 个事务后会停止执行计费技能,在分配用完时,索引器执行历史记录中会显示“超时”消息。

  1. 登录到 Azure 门户

  2. 在“搜索管理 > 技能集”下,从列表中选择技能集。

    技能组页面的屏幕截图。

  3. 滚动到文件中包含 "cognitiveServices" 的部分。

  4. 从 JSON 中删除密钥值并保存技能集。

    技能组 JSON 的屏幕截图。

如何使用密钥

如果每个索引器每天对 Azure AI 服务资源的 API 调用数超过 20 次 API 调用,则基于密钥的计费适用。 可以重置索引器以重置 API 计数。

此密钥用于计费,但不用于扩充操作的连接。 对于连接,搜索服务通过内部网络连接到位于同一物理区域中的 Azure AI 服务资源。 提供 Azure AI 搜索的大多数区域也提供其他 Azure AI 服务,例如语言。 如果尝试在不同时具备这两种服务的区域中进行 AI 扩充,则将看到以下消息:“提供的密钥不是搜索服务区域的有效 CognitiveServices 类型密钥。”

目前,内置技能的计费需要一个从 Azure AI 搜索到另一个 Azure AI 服务的公共连接。 禁用公用网络访问会中断计费。 如果需要禁用公用网络,可以配置使用支持专用终结点Azure Function 实现的自定义 Web API 技能,并将 Azure AI 服务资源添加到同一 VNET。 通过这种方法,可以使用专用终结点直接从自定义技能调用 Azure AI 服务资源。

注意

某些内置技能基于非区域 Azure AI 服务(例如文本翻译技能)。 使用非区域性技能意味着可能会在 Azure AI 搜索区域以外的区域中为你的请求提供服务。 有关非区域性服务的详细信息,请参阅 Azure AI 服务产品(按区域)页。

关键要求特殊情况

自定义实体查找 按 Azure AI 搜索(而不是 Azure AI 服务)计量,但它需要 Azure AI 多服务资源密钥来解锁每个索引器每天超过 20 次的事务。 仅针对此技能,资源键解锁事务数量,但与计费无关。

免费扩充

AI 扩充提供少量可计费扩充的免费处理,无需附加 Azure AI 服务资源即可完成简短的练习。 每个索引器每天的免费扩充量为 20 个文档。 如果你需要重复练习,可以重置索引器以重置计数器。

有些扩充始终免费:

可计费的扩充

在 AI 扩充期间,Azure AI 搜索会调用 Azure AI 服务 API,以获取基于 Azure AI 视觉、翻译和 Azure AI 语言的内置技能

向 Azure AI 服务进行后端调用的可计费内置技能包括实体链接实体识别图像分析关键短语提取语言检测OCR个人身份信息 (PII) 检测情感文本翻译

图像提取是一种 Azure AI 搜索操作,该操作在文档扩充前被破解时发生。 图像提取对所有层都是收费的,免费层每日 20 次免费提取除外。 图像提取成本适用于 blob 中的图像文件、其他文件(PDF 和其他应用程序文件)中的嵌入图像以及使用 Document Extraction 提取的图像。 有关图像提取定价,请参阅 Azure AI 搜索定价页

提示

为了降低技能组处理的成本,启用增量扩充以缓存和重复使用任何不受技能组更改影响的扩充。 缓存需要 Azure 存储(请参阅定价),但如果可以重复使用现有的扩充,则技能组执行的累积成本会降低,尤其是对于使用图像提取和分析的技能组。

示例:估算成本

若要估算 Azure AI 搜索索引编制的相关成本,请先构想一下文档的大致结构,以便能够得出一些数字。 例如,可以使用以下似近值:

  • 1,000 个 PDF。
  • 每个 PDF 有 6 个页面。
  • 每个页面包含一个图像(共 6,000 个图像)。
  • 每个页面包含 3,000 个字符。

假设管道的功能包括:每个 PDF 的文档破解、图像和文本提取、图像的光学字符识别 (OCR),以及组织的实体识别。

本文中所示的价格是虚构的。 这些价格用于演示估算过程。 你的成本可能更低。 有关事务的实际价格,请参阅 Azure AI 服务定价

  1. 破解包含文本和图像内容的文档时,文本提取目前是免费的。 对于 6,000 个图像,假设每提取 1,000 个图像需要 $1。 则此步骤的成本是 $6.00。

  2. 对于英语环境中 6000 个图像的 OCR,OCR 认知技能使用最佳算法 (DescribeText)。 假设每分析 1,000 个图像的成本为 $2.50,则这一步需要支付 $15.00。

  3. 提取实体时,每页总共有 3 个文本记录。 每条记录包含 1,000 个字符。 每页 3 个文本记录 * 6,000 页 = 18,000 个文本记录。 假设 1000 个文本记录的成本为 $2.00,则这一步的成本为 $36.00。

综合起来,在使用上述技能组引入 1,000 个此类 PDF 文档时,需要支付大约 $57.00。

后续步骤