命名实体识别认知技能 (v2)

命名实体识别技能 (v2) 可以从文本中提取命名实体。 可用实体包括 personlocationorganization 类型。

重要

命名实体识别技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 现在已停用,替换为 Microsoft.Skills.Text.V3.EntityRecognitionSkill。 按照已弃用的 Azure AI 搜索技能中的建议,迁移到支持的技能。

注意

通过增大处理频率、添加更多文档或添加更多 AI 算法来扩大范围时,需要附加可计费的 Azure AI 服务资源。 调用 Azure AI 服务中的 API,以及在 Azure AI 搜索中的文档破解阶段提取图像时,会产生费用。 提取文档中的文本不会产生费用。 执行内置技能将按现有的 Azure AI 服务标准预付费套餐价格收费。

图像提取按 Azure AI 搜索计量额外收费,如定价页所述。 文本提取是免费的。

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

数据限制

记录的最大大小应为 50,000 个字符,通过 String.Length 进行测量。 如果在将数据发送到关键短语提取器之前需要拆分数据,请使用文本拆分技能。 如果你使用文本拆分技能,请将页面长度设置为 5000 以获得最佳性能。

技能参数

参数区分大小写。

参数名称 说明
Categories 应提取的类别的数组。 可能类别类型有:"Person""Location""Organization"。 如果不提供类别,则返回所有类型。
defaultLanguageCode 输入文本的语言代码。 支持以下语言:de, en, es, fr, it
minimumPrecision 介于 0 和 1 之间的数字。 如果精度低于此值,则不会返回该实体。 默认值为 0。

技能输入

输入名称 说明
languageCode 可选。 默认值为 "en"
text 要分析的文本。

技能输出

输出名称 说明
人员 一个字符串数组,其中,一个字符串表示一个人员名称。
locations 一个字符串数组,其中,一个字符串表示一个位置。
组织 一个字符串数组,其中,一个字符串表示一个组织。
实体 一个复杂类型数组。 每个复杂类型都包含以下字段:
  • 类别("person""organization""location"
  • 值(实际实体名称)
  • 偏移(在文本中找到它的位置)
  • 置信度(一个介于 0 和 1 之间的值,表示值是实际实体的置信度)

示例定义

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

示例输入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Azure employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

示例输出

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

警告情况

如果文档的语言代码不受支持,则会返回警告,并且不提取任何实体。

另请参阅