共用方式為

在索引编制期间要进行额外处理的技能(Azure AI 搜索)

本文介绍 Azure AI 搜索中的技能,可将这些技能包含在技能组中以便访问外部处理。

技能是一种以某种方式进行内容转换的原子操作。 通常情况下,这是一种可识别或提取文本的操作,但它也可以是一种重塑现有强化的实用工具技能。 输出通常基于文本,用于 全文搜索 或矢量,以便在 矢量搜索中使用。

技能分为以下类别:

  • 内置技能将 API 调用包装到另一个 Azure 资源,其中可以很好地理解输入、输出和处理步骤。 某些内置技能需要附加的资源仅用于计费,而另一些技能则使用 Azure 托管的模型或资源进行计费和处理。

  • 自定义技能提供了自定义代码,以在搜索服务外部执行。 可以通过 URI 访问。 自定义代码通常通过 Azure 函数应用提供。 若要附加开源或第三方矢量化模型,请使用自定义技能。

  • 实用技能是 Azure AI 搜索内部的功能,不依赖于外部资源或出站连接。 大多数实用工具技能不可计费。

内置技能

有两种类型的内置技能:

铸造资源

此类别中的技能调用 Foundry Tools 的子服务。 对于计费而非处理,你必须将 Foundry 资源附加到你的技能组合中。 Azure AI 搜索使用内部资源来执行这些技能,仅在计费时使用 Foundry 资源。

小规模处理是不计费的,但大规模处理则是计费的。 这些技能基于 Foundry Tools 的预先训练模型,这意味着无法使用自己的数据训练模型。

这些技能按标准费率计费。

技能 说明 计费方式
Azure 视觉多模态嵌入 多模式图像和文本矢量化。 Foundry 工具(定价
自定义实体查找 在用户自定义的单词和短语列表中查找文本。 Azure AI 搜索(定价)
实体链接 此技能使用预先训练的模型为已识别的实体生成指向 Wikipedia 文章的链接。 Foundry 工具(定价
实体识别 此技能使用预定型模型为一组固定的类别构建实体:"Person""Location""Organization""Quantity""DateTime""URL""Email""PersonType""Event""Product""Skill""Address""Phone Number""IP Address" 字段。 Foundry 工具(定价
图像分析 此技能使用图像检测算法来识别图像的内容并生成文本说明。 Foundry 工具(定价
关键短语提取 此技能使用预定型模型来检测基于术语放置、语言规则、与其他术语的接近度以及该术语在源数据内的异常程度的重要短语。 Foundry 工具(定价
语言检测 该技能使用预训练模型来检测使用的语言(每个文档一个语言识别码)。 在同一文本段中使用多种语言时,输出是主要使用的语言的 LCID。 Foundry 工具(定价
光学字符识别 光学字符识别。 Foundry 工具(定价
PII 检测 此技能使用预先训练的模型从给定文本中提取个人信息。 此技能还提供了用于遮掩文本中检测到的个人信息实体的各种选项。 Foundry 工具(定价
情绪 此技能使用预先训练的模型,从而根据服务在句子和文档级别逐条记录找到的最高置信度分数来分配情绪标签(例如“消极”、“中立”和“积极”)。 Foundry 工具(定价
文本翻译 此技能使用预先训练的模型将输入文本转换为各种语言,以用于规范化或本地化用例。 Foundry 工具(定价

Azure 托管的模型或资源

此类别中的技能调用你拥有的用于计费和处理的 Azure 托管模型或资源。 尽管 Azure 内容理解是 Foundry 工具的一部分,但 Azure 内容理解技能将连接到已部署的资源进行处理,而不仅仅是计费。

这些技能按标准费率计费。

技能 说明 计费方式
Azure 内容理解 连接到 Azure 内容理解,以便进行高级文档分析和语义分块。 Azure 内容理解(定价
Azure OpenAI 嵌入 连接到已部署的 Azure OpenAI 嵌入模型进行集成向量化。 Azure OpenAI(定价)
GenAI 提示 使用 Foundry 聊天完成模型来扩展 AI 增强管道。 Azure OpenAI(定价)

自定义技能

此类别中的技能包装你设计、开发和部署到 Web 的外部代码。 然后你可以从技能组内调用模块作为自定义技能。

有关创建自定义技能的指导,请参阅定义自定义界面示例:为 AI 扩充创建自定义技能

技能 说明 计费方式
自定义实体查找 通过检测用户定义的实体来扩展 AI 扩充管道。 无,除非解决方案使用按流量计费的 Azure 服务。
Web API 通过 HTTP 调用对自定义 Web API 来扩展 AI 增强管道。 无,除非解决方案使用按流量计费的 Azure 服务。

实用技能

在此类别中的技能仅在 Azure AI 搜索上运行,主要在扩充缓存节点上进行重复操作,且操作大多不可计费。

技能 说明 计费方式
有條件的 允许根据条件进行筛选、分配默认值和合并数据。 不适用
文档提取 从扩充管道内的文件中提取内容。 用于图像提取的 Azure 人工智能搜索(定价
刨床 将输出映射到复杂类型(多部分数据类型,可用于全名、多行地址或姓氏和个人标识符的组合)。 不适用
文本合并 将字段集合中的文本合并到单个字段中。 不适用
文本拆分 将文本拆分为多页,以便以增量方式扩充或增加内容。 不适用