AutoML 文本分类

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件创建基于 AutoML 分类的机器学习模型。

文本分类模型可以将文本分类或归类到预定义的组。 数据集应是一组带标签的文本,其中包含相关标记,用以将每段文本归类到预定义的组。

配置方式

此组件针对文本数据训练 NLP 分类模型。 文本分类是一项监督式学习任务,它需要一个标记的数据集,其中包含一个标签列,而该列在所有行中都有一个值。

此模型需要一个训练数据集和一个验证数据集。 这些数据集必须采用 ML 表格式。

  1. AutoML 文本分类组件添加到你的管道。

  2. 指定你想要模型输出的目标列

  3. 指定你希望 AutoML 用于衡量你的模型成功与否的主要指标

  4. (可选)选择数据集包含的语言。 单击此链接获取受支持语言的完整列表

  5. (可选)可以配置超参数。 请访问此链接,获取可配置的超参数完整列表

  6. (可选)可以配置作业扫描设置。 请访问此链接,详细了解每个可配置的参数

  7. (可选)可以配置作业限制设置。 请访问此链接,详细了解这些设置

后续步骤

请参阅 Azure 机器学习可用的组件集