命名实体识别技能 (v2) 可以从文本中提取命名实体。 可用实体包括 person、location 和 organization 类型。
重要
命名实体识别技能 (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) 现在已停用,替换为 Microsoft.Skills.Text.V3.EntityRecognitionSkill。 按照已弃用的 Azure AI 搜索技能中的建议,迁移到支持的技能。
注释
通过增加处理频率、添加更多文档或添加更多 AI 算法来扩展范围,需要 附加可计费的 Azure Foundry 资源。 在 Foundry 工具中调用 API 以及作为 Azure AI 搜索中文档破解阶段的一部分进行图像提取时,会产生费用。 提取文档中的文本不会产生费用。 执行内置技能按现有的 Foundry 工具标准价格收费。
图像提取按 Azure AI 搜索计量额外收费,如定价页所述。 文本提取是免费的。
@odata.type
Microsoft.Skills.Text.NamedEntityRecognitionSkill
数据限制
记录的最大大小应为 50,000 个字符,通过 String.Length 进行测量。 如果在将数据发送到关键短语提取器之前需要拆分数据,请使用文本拆分技能。 如果你使用文本拆分技能,请将页面长度设置为 5000 以获得最佳性能。
技能参数
参数区分大小写。
| 参数名称 | DESCRIPTION |
|---|---|
| 类别 | 应提取的类别的数组。 可能类别类型有:"Person"、"Location"、"Organization"。 如果不提供类别,则返回所有类型。 |
| defaultLanguageCode | 输入文本的语言代码。 支持以下语言:de, en, es, fr, it |
| minimumPrecision | 介于 0 和 1 之间的数字。 如果精度低于此值,则不会返回该实体。 默认值为 0。 |
技能输入
| 输入名称 | DESCRIPTION |
|---|---|
| languageCode | 可选。 默认值为 "en"。 |
| 文本消息 | 要分析的文本。 |
技能输出
| 输出名称 | DESCRIPTION |
|---|---|
| 人员 | 一个字符串数组,其中,一个字符串表示一个人员名称。 |
| 位置 | 一个字符串数组,其中,一个字符串表示一个位置。 |
| 组织 | 一个字符串数组,其中,一个字符串表示一个组织。 |
| 实体 | 一个复杂类型数组。 每个复杂类型都包含以下字段:
|
示例定义
{
"@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
"categories": [ "Person", "Location", "Organization"],
"defaultLanguageCode": "en",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "persons",
"targetName": "people"
}
]
}
示例输入
{
"values": [
{
"recordId": "1",
"data":
{
"text": "This is the loan application for Joe Romero, a Azure employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
"languageCode": "en"
}
}
]
}
示例输出
{
"values": [
{
"recordId": "1",
"data" :
{
"persons": [ "Joe Romero", "Ana Smith"],
"locations": ["Chile", "Australia"],
"organizations":["Microsoft"],
"entities":
[
{
"category":"person",
"value": "Joe Romero",
"offset": 33,
"confidence": 0.87
},
{
"category":"person",
"value": "Ana Smith",
"offset": 124,
"confidence": 0.87
},
{
"category":"location",
"value": "Chile",
"offset": 88,
"confidence": 0.99
},
{
"category":"location",
"value": "Australia",
"offset": 112,
"confidence": 0.99
},
{
"category":"organization",
"value": "Microsoft",
"offset": 54,
"confidence": 0.99
}
]
}
}
]
}
警告情况
如果文档的语言代码不受支持,则会返回警告,并且不提取任何实体。