如何使用命名实体识别 (NER)
NER 功能可以评估非结构化文本,并从多个预定义类别(例如人员、位置、事件、产品和组织)的文本中提取命名实体。
开发选项
若要使用命名实体识别,需在应用程序中提交原始非结构化文本进行分析并处理 API 输出。 分析按原样执行,不会对数据所用的模型进行其他自定义。 可通过两种方式使用命名实体识别:
开发选项 | 说明 |
---|---|
Language Studio | Language Studio 是一个基于 Web 的平台,让你可以在没有 Azure 帐户的情况下尝试使用文本示例进行实体链接,并在注册时使用自己的数据。 有关详细信息,请参阅 Language Studio 网站或 Language Studio 快速入门。 |
REST API 或客户端库 (Azure SDK) | 使用 REST API 或以各种语言提供的客户端库将命名实体识别集成到应用程序中。 有关详细信息,请参阅命名实体识别快速入门。 |
确定如何处理数据(可选)
输入语言
提交要处理的文档时,可以指定在编写这些文档时采用哪种受支持的语言。如果未指定语言,则关键短语提取将默认为英语。 API 可能会在响应中返回偏移量,以支持不同的多语言和表情符号编码。
提交数据
在收到请求时执行分析。 同步使用 NER 功能是无状态的。 不会在帐户中存储数据,结果会立即在响应中返回。
在以异步方式使用此功能时,API 结果在引入请求时的 24 小时内可用,并在响应中指示。 在此时间段后,结果将被清除,并且不再可用于检索。
此 API 会尝试检测给定文档语言的已定义实体类别。
获取 NER 结果
从 NER 获得结果时,可以将结果流式传输到应用程序或将输出保存到本地系统上的文件中。 API 响应将包括识别的实体,包括其类别和子类别,以及置信度分数。
服务和数据限制
有关每分钟和每秒可以发送的请求大小和数量信息,请参阅服务限制一文。