什么是 Azure 机器学习设计器 (v2)?

Azure 机器学习设计器是一个拖放式 UI 界面,用于在 Azure 机器学习工作区中构建机器学习管道。

如下面的 GIF 所示,可以通过拖放构建基块并连接构建基块来直观地构建管道。

GIF of a building a pipeline in the designer.

注意

设计器支持两种类型的组件:经典预生成组件 (v1) 和自定义组件 (v2)。 这两种类型的组件不兼容。

经典预生成组件支持典型数据处理和机器学习任务,包括回归和分类。 尽管将继续支持经典预生成组件,但不会添加新组件。

自定义组件允许将自己的代码包装为组件,从而在 Azure 机器学习工作室、CLI v2 和 SDK v2 界面之间实现跨工作区共享和无缝创作。

对于新项目,强烈建议使用自定义组件,因为它们与 AzureML V2 兼容,并且将继续接收新的更新。

本文适用于自定义组件。

资产

管道的构建基块在 Azure 机器学习中称为资产,其中包括:

设计器左侧有一个资产库,可在其中访问创建管道所需的所有资产。 它会显示你在工作区中创建的资产,以及你有权访问的注册表中共享的资产。

Screenshot of the asset library.

若要查看特定注册表中的资产,请选择资产库上方的“注册表名称”筛选器。 在当前工作区中创建的资产位于注册表 = 工作区中。 Azure 机器学习提供的资产位于注册表 = azureml 中。

设计器仅显示你在工作区中创建和命名的资产。 你不会在资产库中看到任何未命名的资产。 若要了解如何创建数据和组件资产,请阅读以下文章:

管道

设计器是一种工具,可用于以直观的方式使用资产创建管道。 使用设计器时,会遇到两个与管道相关的概念:管道草稿和管道作业。

Screenshot of pipeline draft and pipeline job list.

管道草稿

在设计器中编辑管道时,你的进度会保存为管道草稿。 可以通过添加或删除组件、配置计算目标、创建参数等,随时编辑管道草稿。

有效的管道草稿具有以下特征:

  • 数据资产只能连接到组件。
  • 组件只能连接到数据资产或其他组件。
  • 组件的所有必需的输入端口必须与数据流建立某种连接。
  • 必须设置每个组件的所有必需参数。

如果已准备好运行管道草稿,请提交管道作业。

管道作业

每次运行管道时,管道及其结果的配置都作为管道作业存储在工作区中。 出于故障排除或审核目的,可以返回任何管道作业以对其进行检查。 克隆管道作业可创建新的管道草稿以供继续编辑。

在设计器中生成管道的方法

从零开始新建管道

可以新建管道,从零开始构建。 记得在设计器中创建管道时选择“自定义组件”选项。

Screenshot showing to select custom component.

克隆现有管道作业

若要基于工作区中的现有管道作业进行操作,可以轻松将此作业克隆到新的管道草稿中以继续编辑。

Screenshot of a pipeline job in the workspace with the clone button highlighted.

克隆后,还可以通过选择“显示世系”来了解该作业是从哪个管道作业克隆的。

Screenshot showing the draft lineage after selecting show lineage button.

可以编辑管道,然后再次提交。 提交后,可以通过在作业详细信息页中选择“显示世系”,查看提交的作业与原始作业之间的世系。

后续步骤