本文概述了用于调整命名实体识别 (NER) API 调用输入的不同 API 参数。 正式版 NER 服务现在支持指定要包含在响应中或从响应中排除的实体标记列表。 如果一段文本被归类为多个实体类型,则 overlapPolicy
参数允许客户指定服务如何处理该重叠。 inferenceOptions
参数允许用户调整推理,例如,在规范化时排除检测到的实体值,也不将其包括在元数据中。
通过 inclusionList
参数,可指定要在推理 JSON(列出 NER 服务识别的所有字词和类别)的实体列表输出中包含的 NER 实体标记。 默认情况下,所有已识别的实体都将列出。
通过 exclusionList
参数,可指定要在推理 JSON(列出 NER 服务识别的所有字词和类别)的实体列表输出中排除的 NER 实体标记。 默认情况下,所有已识别的实体都将列出。
通过 overlapPolicy
参数,可指定 NER 服务如何响应属于多个类别的已识别字词/短语。
默认情况下,overlapPolicy
参数设置为 matchLongest
。 此选项会将提取的字词/短语归类到可以涵盖所提取字词/短语的最长跨度(最长跨度由包含的最多字符数定义)的实体类别下。
此参数的替代选项是 allowOverlap
,该选项将列出所有可能的实体类别。
按支持的 API 版本显示参数
定义可用于调整推理的选项选择。 目前,我们只有一个名为 excludeNormalizedValues
的属性,该属性将检测到的实体值排除在规范化过程之外,并且不会将这些值包含在元数据中。 数值和临时实体类型支持值规范化。
这段示例代码解释了如何使用技能参数。
{
"analysisInput": {
"documents": [
{
"id": "1",
"text": "My name is John Doe",
"language": "en"
}
]
},
"kind": "EntityRecognition",
"parameters": {
"overlapPolicy": {
"policyKind": "AllowOverlap" //AllowOverlap|MatchLongest(default)
},
"inferenceOptions": {
"excludeNormalizedValues": true //(Default: false)
},
"inclusionList": [
"DateAndTime" // A list of entity tags to be used to allow into the response.
],
"exclusionList": ["Date"] // A list of entity tags to be used to filter out from the response.
}
}
- 请参阅配置容器了解配置设置。