AutoML 图像分类多标签

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件创建基于 AutoML 图像分类多标签的机器学习模型。

多标签图像分类是一项计算机视觉任务,其目标是预测与每个图像关联的一组标签。 在需要确定给定图像的多个属性时,可以考虑使用多标签分类。

配置方式

点击此链接,获取此组件可配置参数的完整列表。

此组件会创建分类模型。 由于分类是一种监督式学习方法,所以,你需要一个标记的数据集,其中包含一个标签列,该列在所有行中都有一个值。

此模型需要训练数据集。 验证和测试数据集是可选的。

点击此链接以获取有关 如何准备数据集 的详细信息。数据集需要 已标记的数据集,其中包含所有行都具有值的标签列。

AutoML 会并行(在 specified in max_concurrent_trial 中指定)运行一系列试验(在 max_trials 中指定),这些试验会针对模型尝试不同的算法和参数。 该服务会迭代与超参数选项配对的 ML 算法,且每次试验都会生成带有训练分数的模型。 你可以选择要优化模型的哪个指标。 所选指标的分数越高,模型就越被视为“适合”你的数据。 你可以为试验定义退出条件(终止策略)。 退出条件是具有你希望 AutoML 查找的特定训练分数的模型。 一旦达到定义的退出条件,机器学习就会停止。 然后,此组件将输出在数据集运行结束时生成的最佳模型。 请访问此链接,了解有关 退出条件(终止策略) 的详细信息。

  1. AutoML 图像分类多标签 组件添加到管道。

  2. 指定希望模型输出的 目标列

  3. 指定你希望 AutoML 用于衡量你的模型成功与否的主要指标。 有关计算机视觉的每个主要指标的说明,请访问此链接。

  4. (可选)你可以配置算法设置。 有关支持的计算机视觉算法列表,请访问此链接。

  5. (可选)若要配置作业限制,请访问此链接以获取更多说明

  6. (可选)请访问此链接,查看作业扫描的采样和提前终止的配置列表。还可以找到有关每个策略和采样方法的详细信息。

后续步骤

请参阅 Azure 机器学习可用的组件集