AutoML 回归

本文介绍 Azure 机器学习设计器中的一个组件。

使用此组件创建基于 AutoML 回归的机器学习模型。

配置方式

此模型需要训练数据集。 验证和测试数据集是可选的。

AutoML 会创建多个为你的模型尝试不同算法和参数的并行管道。 该服务将迭代与特征选择配对的 ML 算法,每次迭代都会生成带有训练评分的模型。 你可以选择要优化模型的哪个指标。 所选指标的分数越高,模型就越被视为“适合”你的数据。 可以定义试验的退出条件。 退出条件是具有你希望 AutoML 查找的特定训练分数的模型。 一旦达到定义的退出条件,机器学习就会停止。 然后,此组件将输出在数据集运行结束时生成的最佳模型。 有关退出条件(终止策略)的详细信息,请访问此链接。

  1. AutoML 回归组件添加到你的管道。

  2. 指定你想要模型输出的目标列

  3. (可选)查看附加配置设置:可用来更好地控制训练作业的其他设置。 否则,将会根据试验选择和数据应用默认设置。

    其他配置 说明
    主要指标 用于对模型进行评分的主要指标。 详细了解模型指标
    通过负责任 AI 仪表板调试模型 生成负责任 AI 仪表板,对建议的最佳模型进行整体评估和调试。 这包括模型解释、公平性和性能资源管理器、数据资源管理器和模型错误分析等见解。 详细了解如何生成负责任 AI 仪表板。
    阻止的算法 选择要从训练作业中排除的算法。

    允许算法只适用于 SDK 试验
    请参阅每种任务类型支持的算法
    退出条件 如果满足其中的任一条件,则会停止训练作业。
    训练作业时间(小时) :允许训练作业运行多长时间。
    指标分数阈值:所有管道的最低指标分数。 这可以确保在你具有一个要实现的已定义目标指标时,无需花费不必要的时间来完成训练作业。
    并发 最大并发迭代数:要在训练作业中测试的最大管道(迭代)数。 作业运行的迭代数不会超过指定的数目。 详细了解自动化 ML 如何在群集上执行多个子作业
  4. 可以通过“验证和测试”窗体执行以下操作。

    1. 指定要用于训练作业的验证类型。

    2. 提供测试数据集(预览)以评估自动化 ML 在试验结束时生成的建议模型。 提供测试数据时,将在试验结束时自动触发测试作业。 此测试作业仅在自动化 ML 建议的最佳模型上运行。

      重要

      提供测试数据集来评估生成的模型是一项预览功能。 此功能是一个试验性预览功能,可能会随时更改。

      • 测试数据将被视为独立于训练和验证,这样就不会对建议模型的测试作业结果产生偏差。 详细了解模型验证期间的偏差
      • 可以提供自己的测试数据集,也可以选择使用一定比例的训练数据集。 测试数据必须采用 Azure 机器学习 TabularDataset 的形式。
      • 测试数据集的架构应与训练数据集相匹配。 目标列是可选的,但如果未指示任何目标列,则不会计算测试指标。
      • 测试数据集不应与训练数据集或验证数据集相同。
      • 预测作业不支持训练/测试拆分。

后续步骤

请参阅 Azure 机器学习可用的组件集