AutoML 文本分类

2024/08/29

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件创建基于 AutoML 分类的机器学习模型。

文本分类模型可以将文本分类或归类到预定义的组。数据集应是一组带标签的文本，其中包含相关标记，用以将每段文本归类到预定义的组。

配置方式

此组件针对文本数据训练 NLP 分类模型。文本分类是一项监督式学习任务，它需要一个标记的数据集，其中包含一个标签列，而该列在所有行中都有一个值。

此模型需要一个训练数据集和一个验证数据集。这些数据集必须采用 ML 表格式。

将 AutoML 文本分类组件添加到你的管道。
指定你想要模型输出的目标列
指定你希望 AutoML 用于衡量你的模型成功与否的主要指标。
（可选）选择数据集包含的语言。单击此链接获取受支持语言的完整列表。
（可选）可以配置超参数。请访问此链接，获取可配置的超参数完整列表
（可选）可以配置作业扫描设置。请访问此链接，详细了解每个可配置的参数。
（可选）可以配置作业限制设置。请访问此链接，详细了解这些设置。

后续步骤

请参阅 Azure 机器学习可用的组件集。