AutoML 回归
本文介绍 Azure 机器学习设计器中的一个组件。
使用此组件创建基于 AutoML 回归的机器学习模型。
配置方式
此模型需要训练数据集。 验证和测试数据集是可选的。
AutoML 会创建多个为你的模型尝试不同算法和参数的并行管道。 该服务将迭代与特征选择配对的 ML 算法,每次迭代都会生成带有训练评分的模型。 你可以选择要优化模型的哪个指标。 所选指标的分数越高,模型就越被视为“适合”你的数据。 可以定义试验的退出条件。 退出条件是具有你希望 AutoML 查找的特定训练分数的模型。 一旦达到定义的退出条件,机器学习就会停止。 然后,此组件将输出在数据集运行结束时生成的最佳模型。 有关退出条件(终止策略)的详细信息,请访问此链接。
将 AutoML 回归组件添加到你的管道。
指定你想要模型输出的目标列
(可选)查看附加配置设置:可用来更好地控制训练作业的其他设置。 否则,将会根据试验选择和数据应用默认设置。
其他配置 说明 主要指标 用于对模型进行评分的主要指标。 详细了解模型指标。 通过负责任 AI 仪表板调试模型 生成负责任 AI 仪表板,对建议的最佳模型进行整体评估和调试。 这包括模型解释、公平性和性能资源管理器、数据资源管理器和模型错误分析等见解。 详细了解如何生成负责任 AI 仪表板。 阻止的算法 选择要从训练作业中排除的算法。
允许算法只适用于 SDK 试验。
请参阅每种任务类型支持的算法。退出条件 如果满足其中的任一条件,则会停止训练作业。
训练作业时间(小时) :允许训练作业运行多长时间。
指标分数阈值:所有管道的最低指标分数。 这可以确保在你具有一个要实现的已定义目标指标时,无需花费不必要的时间来完成训练作业。并发 最大并发迭代数:要在训练作业中测试的最大管道(迭代)数。 作业运行的迭代数不会超过指定的数目。 详细了解自动化 ML 如何在群集上执行多个子作业。 可以通过“验证和测试”窗体执行以下操作。
指定要用于训练作业的验证类型。
提供测试数据集(预览)以评估自动化 ML 在试验结束时生成的建议模型。 提供测试数据时,将在试验结束时自动触发测试作业。 此测试作业仅在自动化 ML 建议的最佳模型上运行。
重要
提供测试数据集来评估生成的模型是一项预览功能。 此功能是一个试验性预览功能,可能会随时更改。
- 测试数据将被视为独立于训练和验证,这样就不会对建议模型的测试作业结果产生偏差。 详细了解模型验证期间的偏差。
- 可以提供自己的测试数据集,也可以选择使用一定比例的训练数据集。 测试数据必须采用 Azure 机器学习 TabularDataset 的形式。
- 测试数据集的架构应与训练数据集相匹配。 目标列是可选的,但如果未指示任何目标列,则不会计算测试指标。
- 测试数据集不应与训练数据集或验证数据集相同。
- 预测作业不支持训练/测试拆分。
后续步骤
请参阅 Azure 机器学习可用的组件集。