命名实体识别认知技能 (v2)
命名实体识别技能 (v2) 可以从文本中提取命名实体。 可用实体包括 person
、location
和 organization
类型。
重要
命名实体识别技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 现在已停用,替换为 Microsoft.Skills.Text.V3.EntityRecognitionSkill。 按照已弃用的 Azure AI 搜索技能中的建议,迁移到支持的技能。
注意
通过增大处理频率、添加更多文档或添加更多 AI 算法来扩大范围时,需要附加可计费的 Azure AI 服务资源。 调用 Azure AI 服务中的 API,以及在 Azure AI 搜索中的文档破解阶段提取图像时,会产生费用。 提取文档中的文本不会产生费用。 执行内置技能将按现有的 Azure AI 服务标准预付费套餐价格收费。
图像提取按 Azure AI 搜索计量额外收费,如定价页所述。 文本提取是免费的。
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
数据限制
记录的最大大小应为 50,000 个字符,通过 String.Length
进行测量。 如果在将数据发送到关键短语提取器之前需要拆分数据,请使用文本拆分技能。 如果你使用文本拆分技能,请将页面长度设置为 5000 以获得最佳性能。
技能参数
参数区分大小写。
参数名称 | 说明 |
---|---|
Categories | 应提取的类别的数组。 可能类别类型有:"Person" 、"Location" 、"Organization" 。 如果不提供类别,则返回所有类型。 |
defaultLanguageCode | 输入文本的语言代码。 支持以下语言:de, en, es, fr, it |
minimumPrecision | 介于 0 和 1 之间的数字。 如果精度低于此值,则不会返回该实体。 默认值为 0。 |
技能输入
输入名称 | 说明 |
---|---|
languageCode | 可选。 默认值为 "en" 。 |
text | 要分析的文本。 |
技能输出
输出名称 | 说明 |
---|---|
人员 | 一个字符串数组,其中,一个字符串表示一个人员名称。 |
locations | 一个字符串数组,其中,一个字符串表示一个位置。 |
组织 | 一个字符串数组,其中,一个字符串表示一个组织。 |
实体 | 一个复杂类型数组。 每个复杂类型都包含以下字段:
|
示例定义
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
示例输入
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Azure employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
示例输出
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
警告情况
如果文档的语言代码不受支持,则会返回警告,并且不提取任何实体。