AutoML 预测
本文介绍 Azure 机器学习设计器中的一个组件。
使用此组件创建基于 AutoML 预测的机器学习模型。
配置方式
此组件创建预测模型。 因为预测是一种监督式学习方法,所以,你需要一个标记的数据集,其中包含一个标签列,该列在所有行中都有一个值。 通过此链接获取关于如何准备数据集的详细信息。数据集需要一个标记的数据集,它必须包含一个所有行都具有值的标签列。
此模型需要训练数据集。 验证和测试数据集是可选的。
AutoML 会创建多个为你的模型尝试不同算法和参数的并行管道。 该服务将迭代与特征选择配对的 ML 算法,每次迭代都会生成带有训练评分的模型。 你可以选择要优化模型的哪个指标。 所选指标的分数越高,模型就越被视为“适合”你的数据。 可以定义试验的退出条件。 退出条件是具有你希望 AutoML 查找的特定训练分数的模型。 一旦达到定义的退出条件,机器学习就会停止。 然后,此组件将输出在数据集运行结束时生成的最佳模型。
将 AutoML 预测组件添加到管道。
指定你希望模型使用的 training_data。
指定你希望 AutoML 用于衡量你的模型成功与否的主要指标。
指定你想要模型输出的目标列
在“任务类型和设置”窗体上,选择任务类型:预测。 有关详细信息,请参阅支持的任务类型。
对于预测,可以
启用深度学习。
选择“时间列”:此列包含要使用的时间数据。
选择“预测范围”:指示模型可以预测未来的多少个时间单位(分钟/小时/天/周/月/年)。 模型需要预测的未来越远,其准确性越低。 详细了解预测和预测范围。
(可选)查看附加配置设置:可用来更好地控制训练作业的其他设置。 否则,将会根据试验选择和数据应用默认设置。
其他配置 说明 主要指标 用于对模型进行评分的主要指标。 详细了解模型指标。 解释最佳模型 选择启用或禁用,以确定是否显示建议的最佳模型的说明。
此功能当前不可用于特定的预测算法。阻止的算法 选择要从训练作业中排除的算法。
允许算法只适用于 SDK 试验。
请参阅每种任务类型支持的算法。退出条件 如果满足其中的任一条件,则会停止训练作业。
训练作业时间(小时) :允许训练作业运行多长时间。
指标分数阈值:所有管道的最低指标分数。 这可以确保在你具有一个要实现的已定义目标指标时,无需花费不必要的时间来完成训练作业。并发 最大并发迭代数:要在训练作业中测试的最大管道(迭代)数。 作业运行的迭代数不会超过指定的数目。 详细了解自动化 ML 如何在群集上执行多个子作业。
后续步骤
请参阅 Azure 机器学习可用的组件集。