命名实体识别认知技能 (v2)

命名实体识别技能 (v2) 可以从文本中提取命名实体。 可用实体包括 personlocationorganization 类型。

重要

命名实体识别技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 现在已停用,替换为 Microsoft.Skills.Text.V3.EntityRecognitionSkill。 按照已弃用的 Azure AI 搜索技能中的建议,迁移到支持的技能。

注释

通过增加处理频率、添加更多文档或添加更多 AI 算法来扩展范围,需要 附加可计费的 Azure Foundry 资源。 在 Foundry 工具中调用 API 以及作为 Azure AI 搜索中文档破解阶段的一部分进行图像提取时,会产生费用。 提取文档中的文本不会产生费用。 执行内置技能按现有的 Foundry 工具标准价格收费。

图像提取按 Azure AI 搜索计量额外收费,如定价页所述。 文本提取是免费的。

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

数据限制

记录的最大大小应为 50,000 个字符,通过 String.Length 进行测量。 如果在将数据发送到关键短语提取器之前需要拆分数据,请使用文本拆分技能。 如果你使用文本拆分技能,请将页面长度设置为 5000 以获得最佳性能。

技能参数

参数区分大小写。

参数名称 DESCRIPTION
类别 应提取的类别的数组。 可能类别类型有:"Person""Location""Organization"。 如果不提供类别,则返回所有类型。
defaultLanguageCode 输入文本的语言代码。 支持以下语言:de, en, es, fr, it
minimumPrecision 介于 0 和 1 之间的数字。 如果精度低于此值,则不会返回该实体。 默认值为 0。

技能输入

输入名称 DESCRIPTION
languageCode 可选。 默认值为 "en"
文本消息 要分析的文本。

技能输出

输出名称 DESCRIPTION
人员 一个字符串数组,其中,一个字符串表示一个人员名称。
位置 一个字符串数组,其中,一个字符串表示一个位置。
组织 一个字符串数组,其中,一个字符串表示一个组织。
实体 一个复杂类型数组。 每个复杂类型都包含以下字段:
  • 类别("person""organization""location"
  • 值(实际实体名称)
  • 偏移(在文本中找到它的位置)
  • 置信度(一个介于 0 和 1 之间的值,表示值是实际实体的置信度)

示例定义

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

示例输入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Azure employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

示例输出

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

警告情况

如果文档的语言代码不受支持,则会返回警告,并且不提取任何实体。

另请参阅