将 Azure AI 多服务资源附加到 Azure AI 搜索中的技能组
在 Azure AI 搜索中配置可选的 AI 扩充管道时,可以免费扩充有限数量的文档。 对于更大、更频繁的工作负荷,应附加可计费的 Azure AI 多服务资源。
多服务资源将一组“Azure AI 服务”引用为套餐而不是单独的服务,并通过单个 API 密钥授予访问权限。 此密钥在技能组中指定,并允许 Azure 向你收取使用这些服务的费用:
- 用于图像分析和光学字符识别 (OCR) 的 Azure AI 视觉
- 用于语言检测、实体识别、情绪分析和关键短语提取的 Azure AI 语言
- 用于语音转文本和文本转语音的 Azure AI 语音
- 用于机器文本翻译的Azure AI 翻译
设置资源密钥
可以使用 Azure 门户、REST API 或 Azure SDK 将可计费资源附加到技能集。
如果未指定该属性,搜索服务会尝试使用索引器每天可用的免费扩充量。 每个索引器调用执行 20 个事务后会停止执行计费技能,索引器执行历史记录中会显示“超时”消息。
登录 Azure 门户。
在搜索服务所在的同一区域中创建 Azure AI 多服务资源。
向技能组定义添加密钥:
如果使用的是导入数据向导,请在第二步“添加 AI 扩充”中输入密钥。
如果将密钥添加到新的或现有的技能组,请在“Azure AI 服务”选项卡中提供密钥。
删除密钥
扩充是收费操作。 如果不再需要调用 Azure AI 服务,请按照这些说明删除多区域密钥并阻止使用外部资源。 如果没有密钥,技能组会还原为每天为每个索引器默认分配 20 个免费事务。 在达到 20 个事务后会停止执行计费技能,在分配用完时,索引器执行历史记录中会显示“超时”消息。
如何使用密钥
如果每个索引器每天对 Azure AI 服务资源的 API 调用数超过 20 次 API 调用,则基于密钥的计费适用。
此密钥用于计费,但不用于扩充操作的连接。 对于连接,搜索服务通过内部网络连接到位于同一物理区域中的 Azure AI 服务资源。 提供 Azure AI 搜索的大多数区域也提供其他 Azure AI 服务,例如语言。 如果尝试在不同时具备这两种服务的区域中进行 AI 扩充,则将看到以下消息:“提供的密钥不是搜索服务区域的有效 CognitiveServices 类型密钥。”
目前,内置技能的计费需要一个从 Azure AI 搜索到另一个 Azure AI 服务的公共连接。 禁用公用网络访问会中断计费。 如果需要禁用公用网络,可以配置使用支持专用终结点的 Azure Function 实现的自定义 Web API 技能,并将 Azure AI 服务资源添加到同一 VNET。 通过这种方法,可以使用专用终结点直接从自定义技能调用 Azure AI 服务资源。
注意
某些内置技能基于非区域 Azure AI 服务(例如文本翻译技能)。 使用非区域性技能意味着可能会在 Azure AI 搜索区域以外的区域中为你的请求提供服务。 有关非区域性服务的详细信息,请参阅 Azure AI 服务产品(按区域)页。
关键要求特殊情况
自定义实体查找 按 Azure AI 搜索(而不是 Azure AI 服务)计量,但它需要 Azure AI 多服务资源密钥来解锁每个索引器每天超过 20 次的事务。 仅针对此技能,资源键解锁事务数量,但与计费无关。
免费扩充
AI 扩充提供少量可计费扩充的免费处理,无需附加 Azure AI 服务资源即可完成简短的练习。 每个索引器每天的免费扩充量为 20 个文档。 如果你需要重复练习,可以重置索引器以重置计数器。
有些扩充始终免费:
从 PDF 文档和其他应用程序文件提取文本是不计费的。 文本提取在文档破解期间发生,它不是扩充,但在 AI 扩充过程中发生,因此在此进行说明。
可计费的扩充
在 AI 扩充期间,Azure AI 搜索会调用 Azure AI 服务 API,以获取基于 Azure AI 视觉、翻译和 Azure AI 语言的内置技能。
向 Azure AI 服务进行后端调用的可计费内置技能包括实体链接、实体识别、图像分析、关键短语提取、语言检测、OCR、个人身份信息 (PII) 检测、情感和文本翻译。
图像提取是一种 Azure AI 搜索操作,该操作在文档扩充前被破解时发生。 图像提取对所有层都是收费的,免费层每日 20 次免费提取除外。 图像提取成本适用于 blob 中的图像文件、其他文件(PDF 和其他应用程序文件)中的嵌入图像以及使用 Document Extraction 提取的图像。 有关图像提取定价,请参阅 Azure AI 搜索定价页。
提示
为了降低技能集处理的成本,启用增量扩充以缓存和重复使用任何不受技能集更改影响的扩充。 缓存需要 Azure 存储(请参阅定价),但如果可以重复使用现有的扩充,则技能组执行的累积成本会降低,尤其是对于使用图像提取和分析的技能组。
示例:估算成本
若要估算 Azure AI 搜索索引编制的相关成本,请先构想一下文档的大致结构,以便能够得出一些数字。 例如,可以使用以下似近值:
- 1,000 个 PDF。
- 每个 PDF 有 6 个页面。
- 每个页面包含一个图像(共 6,000 个图像)。
- 每个页面包含 3,000 个字符。
假设管道的功能包括:每个 PDF 的文档破解、图像和文本提取、图像的光学字符识别 (OCR),以及组织的实体识别。
本文中所示的价格是虚构的。 这些价格用于演示估算过程。 你的成本可能更低。 有关事务的实际价格,请参阅 Azure AI 服务定价。
破解包含文本和图像内容的文档时,文本提取目前是免费的。 对于 6,000 个图像,假设每提取 1,000 个图像需要 $1。 则此步骤的成本是 $6.00。
对于英语环境中 6000 个图像的 OCR,OCR 认知技能使用最佳算法 (DescribeText)。 假设每分析 1,000 个图像的成本为 $2.50,则这一步需要支付 $15.00。
提取实体时,每页总共有 3 个文本记录。 每条记录包含 1,000 个字符。 每页 3 个文本记录 * 6,000 页 = 18,000 个文本记录。 假设 1000 个文本记录的成本为 $2.00,则这一步的成本为 $36.00。
综合起来,在使用上述技能集引入 1,000 个此类 PDF 文档时,需要支付大约 $57.00。