什么是 Azure 机器学习设计器 (v2)?
Azure 机器学习设计器是一个拖放式 UI 界面,用于在 Azure 机器学习工作区中构建机器学习管道。
如下面的 GIF 所示,可以通过拖放构建基块并连接构建基块来直观地构建管道。
注意
设计器支持两种类型的组件:经典预生成组件 (v1) 和自定义组件 (v2)。 这两种类型的组件不兼容。
经典预生成组件支持典型数据处理和机器学习任务,包括回归和分类。 尽管将继续支持经典预生成组件,但不会添加新组件。
自定义组件允许将自己的代码包装为组件,从而在 Azure 机器学习工作室、CLI v2 和 SDK v2 界面之间实现跨工作区共享和无缝创作。
对于新项目,强烈建议使用自定义组件,因为它们与 AzureML V2 兼容,并且将继续接收新的更新。
本文适用于自定义组件。
资产
管道的构建基块在 Azure 机器学习中称为资产,其中包括:
设计器左侧有一个资产库,可在其中访问创建管道所需的所有资产。 它会显示你在工作区中创建的资产,以及你有权访问的注册表中共享的资产。
若要查看特定注册表中的资产,请选择资产库上方的“注册表名称”筛选器。 在当前工作区中创建的资产位于注册表 = 工作区中。 Azure 机器学习提供的资产位于注册表 = azureml 中。
设计器仅显示你在工作区中创建和命名的资产。 你不会在资产库中看到任何未命名的资产。 若要了解如何创建数据和组件资产,请阅读以下文章:
管道
设计器是一种工具,可用于以直观的方式使用资产创建管道。 使用设计器时,会遇到两个与管道相关的概念:管道草稿和管道作业。
管道草稿
在设计器中编辑管道时,你的进度会保存为管道草稿。 可以通过添加或删除组件、配置计算目标、创建参数等,随时编辑管道草稿。
有效的管道草稿具有以下特征:
- 数据资产只能连接到组件。
- 组件只能连接到数据资产或其他组件。
- 组件的所有必需的输入端口必须与数据流建立某种连接。
- 必须设置每个组件的所有必需参数。
如果已准备好运行管道草稿,请提交管道作业。
管道作业
每次运行管道时,管道及其结果的配置都作为管道作业存储在工作区中。 出于故障排除或审核目的,可以返回任何管道作业以对其进行检查。 克隆管道作业可创建新的管道草稿以供继续编辑。
在设计器中生成管道的方法
从零开始新建管道
可以新建管道,从零开始构建。 记得在设计器中创建管道时选择“自定义组件”选项。
克隆现有管道作业
若要基于工作区中的现有管道作业进行操作,可以轻松将此作业克隆到新的管道草稿中以继续编辑。
克隆后,还可以通过选择“显示世系”来了解该作业是从哪个管道作业克隆的。
可以编辑管道,然后再次提交。 提交后,可以通过在作业详细信息页中选择“显示世系”,查看提交的作业与原始作业之间的世系。