将 Azure AI 多服务资源附加到 Azure AI 搜索中的技能组
在 Azure AI 搜索中配置可选的 AI 扩充管道时,可以免费扩充少量文档,每个索引每天最多 20 个事务。 对于更大、更频繁的工作负荷,应附加可计费的 Azure AI 多服务资源。
多服务帐户提供 Azure AI 服务的集合,而不是单个服务。 通过在 Azure AI 搜索技能组中提供帐户,允许 Azure 向你收取使用这些服务的费用:
- Azure AI 视觉,用于图像分析、光学字符识别 (OCR) 和多模态文本和图像嵌入。
- 用于语言检测、实体识别、情绪分析和关键短语提取的 Azure AI 语言
- 用于语音转文本和文本转语音的 Azure AI 语音
- 用于机器文本翻译的Azure AI 翻译
必须在技能组中向 Azure AI 多资源提供连接信息。 Azure AI 搜索不使用技能组工作负载的连接,但它确实使用连接来访问对资源的计费计量。 因此,Azure AI 服务帐户用于计费,而不是用于技能处理。 Azure AI 搜索使用单独的专用资源来进行技能处理。
可以在连接上使用密钥,也可以实现当前处于预览状态的无密钥方法。
提示
Azure 提供用于监视计费和预算的基础结构。
先决条件
- 除非搜索服务满足与 Azure AI 多服务帐户的专用连接的创建日期、层和区域要求,否则通过公共终结点建立连接。
注意
如果 Azure AI 资源配置为使用专用终结点,则 Azure AI 搜索可以使用共享专用链接进行连接,前提是搜索服务是在 2024 年 4 月 3 日之后创建的,并且位于提供更高容量计算能力且位于受支持的层的区域。 有关详细信息,请参阅使用共享专用链接的要求。
获取 Azure AI 多服务帐户的资源密钥
通过资源密钥计费
Azure AI 搜索还可以使用 Azure AI 多服务资源密钥对事务收费。 此方法是默认方法,已正式发布。 可以使用 Azure 门户、REST API 或 Azure SDK 将密钥添加到技能集。
只需添加密钥,而不是子域或终结点。 如果未指定 cognitiveServices
属性,搜索服务会尝试使用索引器每天可用的免费扩充量。 每个索引器调用执行 20 个事务后会停止执行计费技能,索引器执行历史记录中会显示“超时”消息。
登录 Azure 门户。
在搜索服务所在的同一区域中创建 Azure AI 多服务资源。
从“资源”>“密钥和终结点”页获取资源密钥。
向技能组定义添加密钥:
如果使用导入数据向导,请创建或选择 Azure AI 帐户。 该向导会将资源密钥添加到技能集定义。
对于新的或现有的技能集,请提供技能集定义中的密钥。
删除密钥
扩充是收费操作。 如果不再需要调用 Azure AI 服务,请按照这些说明移除多服务密钥并阻止使用外部资源。 如果没有密钥,技能组会还原为每天为每个索引器默认分配 20 个免费事务。 在达到 20 个事务后会停止执行计费技能,在分配用完时,索引器执行历史记录中会显示“超时”消息。
登录到 Azure 门户。
在“搜索管理 > 技能集”下,从列表中选择技能集。
滚动到文件中包含
"cognitiveServices"
的部分。从 JSON 中删除密钥值并保存技能集。
如何使用密钥
如果每个索引器每天对 Azure AI 服务资源的 API 调用数超过 20 次 API 调用,则计费将生效。 可以重置索引器以重置 API 计数。
无密钥连接和基于密钥的连接用于计费,但不用于扩充操作的连接。 对于连接,搜索服务通过内部网络连接到位于同一物理区域中的 Azure AI 服务资源。 提供 Azure AI 搜索的大多数区域也提供其他 Azure AI 服务,例如语言。 如果尝试在不同时具备这两种服务的区域中进行 AI 扩充,则将看到以下消息:“提供的密钥不是搜索服务区域的有效 CognitiveServices 类型密钥。”
可以将索引器配置为在专用执行环境中运行,仅使用自己的搜索服务的搜索节点进行专用处理。 即使你使用的是专用执行环境,Azure AI 搜索仍使用其内部预配的 Azure AI 多服务资源来执行所有技能扩充。
注意
某些内置技能基于非区域 Azure AI 服务(例如文本翻译技能)。 使用非区域性技能意味着可能会在 Azure AI 搜索区域以外的区域中为你的请求提供服务。 有关非区域性服务的详细信息,请参阅 Azure AI 服务产品(按区域)页。
关键要求特殊情况
自定义实体查找 按 Azure AI 搜索(而不是 Azure AI 服务)计量,但它需要 Azure AI 多服务资源密钥来解锁每个索引器每天超过 20 次的事务。 仅针对此技能,资源键解锁事务数量,但与计费无关。
免费扩充
AI 扩充提供少量可计费扩充的免费处理,无需附加 Azure AI 服务资源即可完成简短的练习。 每个索引器每天的免费扩充量为 20 个文档。 如果你需要重复练习,可以重置索引器以重置计数器。
有些扩充始终免费:
从 PDF 文档和其他应用程序文件提取文本是不计费的。 文本提取在文档破解期间发生,它不是扩充,但在 AI 扩充过程中发生,因此在此进行说明。
可计费的扩充
在 AI 扩充期间,Azure AI 搜索会调用 Azure AI 服务 API,以获取基于 Azure AI 视觉、翻译和 Azure AI 语言的内置技能。
向 Azure AI 服务进行后端调用的可计费内置技能包括实体链接、实体识别、图像分析、关键短语提取、语言检测、OCR、个人身份信息 (PII) 检测、情感和文本翻译。
图像提取是一种 Azure AI 搜索操作,该操作在文档扩充前被破解时发生。 图像提取对所有层都是收费的,免费层每日 20 次免费提取除外。 图像提取成本适用于 blob 中的图像文件、其他文件(PDF 和其他应用程序文件)中的嵌入图像以及使用 Document Extraction 提取的图像。 有关图像提取定价,请参阅 Azure AI 搜索定价页。
提示
为了降低技能组处理的成本,启用增量扩充以缓存和重复使用任何不受技能组更改影响的扩充。 缓存需要 Azure 存储(请参阅定价),但如果可以重复使用现有的扩充,则技能组执行的累积成本会降低,尤其是对于使用图像提取和分析的技能组。
示例:估算成本
若要估算 Azure AI 搜索索引编制的相关成本,请先构想一下文档的大致结构,以便能够得出一些数字。 例如,可以使用以下似近值:
- 1,000 个 PDF。
- 每个 PDF 有 6 个页面。
- 每个页面包含一个图像(共 6,000 个图像)。
- 每个页面包含 3,000 个字符。
假设管道的功能包括:每个 PDF 的文档破解、图像和文本提取、图像的光学字符识别 (OCR),以及组织的实体识别。
本文中所示的价格是虚构的。 这些价格用于演示估算过程。 你的成本可能更低。 有关事务的实际价格,请参阅 Azure AI 服务定价。
破解包含文本和图像内容的文档时,文本提取目前是免费的。 对于 6,000 个图像,假设每提取 1,000 个图像需要 $1。 则此步骤的成本是 $6.00。
对于英语环境中 6000 个图像的 OCR,OCR 认知技能使用最佳算法 (DescribeText)。 假设每分析 1,000 个图像的成本为 $2.50,则这一步需要支付 $15.00。
提取实体时,每页总共有 3 个文本记录。 每条记录包含 1,000 个字符。 每页 3 个文本记录 * 6,000 页 = 18,000 个文本记录。 假设 1000 个文本记录的成本为 $2.00,则这一步的成本为 $36.00。
综合起来,在使用上述技能组引入 1,000 个此类 PDF 文档时,需要支付大约 $57.00。