AutoML 预测

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件创建基于 AutoML 预测的机器学习模型。

配置方式

此组件创建预测模型。 因为预测是一种监督式学习方法,所以,你需要一个标记的数据集,其中包含一个标签列,该列在所有行中都有一个值。 通过此链接获取关于如何准备数据集的详细信息。数据集需要一个标记的数据集,它必须包含一个所有行都具有值的标签列。

此模型需要训练数据集。 验证和测试数据集是可选的。

AutoML 会创建多个为你的模型尝试不同算法和参数的并行管道。 该服务将迭代与特征选择配对的 ML 算法,每次迭代都会生成带有训练评分的模型。 你可以选择要优化模型的哪个指标。 所选指标的分数越高,模型就越被视为“适合”你的数据。 可以定义试验的退出条件。 退出条件是具有你希望 AutoML 查找的特定训练分数的模型。 一旦达到定义的退出条件,机器学习就会停止。 然后,此组件将输出在数据集运行结束时生成的最佳模型。

  1. 将 AutoML 预测组件添加到管道。

  2. 指定你希望模型使用的 training_data。

  3. 指定你希望 AutoML 用于衡量你的模型成功与否的主要指标

  4. 指定你想要模型输出的目标列

  5. 在“任务类型和设置”窗体上,选择任务类型:预测。 有关详细信息,请参阅支持的任务类型

    1. 对于预测,可以

      1. 启用深度学习。

      2. 选择“时间列”:此列包含要使用的时间数据。

      3. 选择“预测范围”:指示模型可以预测未来的多少个时间单位(分钟/小时/天/周/月/年)。 模型需要预测的未来越远,其准确性越低。 详细了解预测和预测范围

  6. (可选)查看附加配置设置:可用来更好地控制训练作业的其他设置。 否则,将会根据试验选择和数据应用默认设置。

    其他配置 说明
    主要指标 用于对模型进行评分的主要指标。 详细了解模型指标
    解释最佳模型 选择启用或禁用,以确定是否显示建议的最佳模型的说明。
    此功能当前不可用于特定的预测算法
    阻止的算法 选择要从训练作业中排除的算法。

    允许算法只适用于 SDK 试验
    请参阅每种任务类型支持的算法
    退出条件 如果满足其中的任一条件,则会停止训练作业。
    训练作业时间(小时) :允许训练作业运行多长时间。
    指标分数阈值:所有管道的最低指标分数。 这可以确保在你具有一个要实现的已定义目标指标时,无需花费不必要的时间来完成训练作业。
    并发 最大并发迭代数:要在训练作业中测试的最大管道(迭代)数。 作业运行的迭代数不会超过指定的数目。 详细了解自动化 ML 如何在群集上执行多个子作业

后续步骤

请参阅 Azure 机器学习可用的组件集