AutoML 文本 NER(命名实体识别)

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件创建基于 AutoML 文本 NER 的机器学习模型。

命名实体识别 (NER) 是 Azure AI 语言提供的功能之一。 NER 功能可以识别非结构化文本中的实体并进行分类。 有关 NER 的详细信息

配置方式

此组件针对文本数据训练 NLP 分类模型。 文本分类是一项监督式学习任务,它需要一个标记的数据集,其中包含一个标签列,而该列在所有行中都有一个值。

此模型需要训练和验证数据集。 这些数据集必须采用 ML 表格式。

  1. 将 AutoML 文本 NER 组件添加到管道。

  2. 指定希望 AutoML 用于衡量模型是否成功的主要指标。

  3. (可选)选择数据集包含的语言。 单击此链接获取受支持语言的完整列表

  4. (可选)可以配置超参数。 请访问此链接,获取可配置的超参数完整列表

  5. (可选)可以配置作业扫描设置。 请访问此链接,详细了解每个可配置的参数

  6. (可选)可以配置作业限制设置。 请访问此链接,详细了解这些设置

后续步骤

请参阅 Azure 机器学习可用的组件集