命名实体识别认知技能 (v2)

项目
2023/12/29

命名实体识别技能 (v2) 可以从文本中提取命名实体。可用实体包括 person、location 和 organization 类型。

重要

命名实体识别技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 现在已停用，替换为 Microsoft.Skills.Text.V3.EntityRecognitionSkill。按照已弃用的 Azure AI 搜索技能中的建议，迁移到支持的技能。

备注

通过增大处理频率、添加更多文档或添加更多 AI 算法来扩大范围时，需要附加可计费的 Azure AI 服务资源。调用 Azure AI 服务中的 API，以及在 Azure AI 搜索中的文档破解阶段提取图像时，会产生费用。提取文档中的文本不会产生费用。执行内置技能将按现有的 Azure AI 服务标准预付费套餐价格收费。

图像提取按 Azure AI 搜索计量额外收费，如定价页所述。文本提取是免费的。

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

数据限制

记录的最大大小应为 50,000 个字符，通过 String.Length 进行测量。如果在将数据发送到关键短语提取器之前需要拆分数据，请使用文本拆分技能。如果你使用文本拆分技能，请将页面长度设置为 5000 以获得最佳性能。

技能参数

参数区分大小写。

参数名称	说明
Categories	应提取的类别的数组。可能类别类型有：`"Person"`、`"Location"`、`"Organization"`。如果不提供类别，则返回所有类型。
defaultLanguageCode	输入文本的语言代码。支持以下语言：`de, en, es, fr, it`
minimumPrecision	介于 0 和 1 之间的数字。如果精度低于此值，则不会返回该实体。默认值为 0。

技能输入

输入名称	说明
languageCode	可选。默认值为 `"en"`。
text	要分析的文本。

技能输出

输出名称	说明
人员	一个字符串数组，其中，一个字符串表示一个人员名称。
locations	一个字符串数组，其中，一个字符串表示一个位置。
组织	一个字符串数组，其中，一个字符串表示一个组织。
实体	一个复杂类型数组。每个复杂类型都包含以下字段：类别（`"person"`、`"organization"` 或 `"location"`）值（实际实体名称）偏移（在文本中找到它的位置）置信度（一个介于 0 和 1 之间的值，表示值是实际实体的置信度）

示例定义

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

示例输入

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Azure employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

示例输出

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

警告情况

如果文档的语言代码不受支持，则会返回警告，并且不提取任何实体。

未来属于你

通过

@odata.type

数据限制

技能参数

技能输入

技能输出

示例定义

示例输入

示例输出

警告情况

另请参阅

通过

命名实体识别认知技能 (v2)

@odata.type

数据限制

技能参数

技能输入

技能输出

示例定义

示例输入

示例输出

警告情况

另请参阅

其他资源