使用 Azure 机器学习设计器运行批量预测

本文介绍如何使用设计器创建批量预测管道。 借助批量预测,可以使用可从任何 HTTP 库触发的 Web 服务按需对大型数据集持续评分。

在本操作指南中,你将了解如何执行以下任务:

  • 创建并发布批量推理管道
  • 使用管道终结点
  • 管理终结点版本

若要了解如何使用 SDK 设置批量评分服务,请参阅随附的管道批量评分教程

先决条件

本操作指南假设你已有一个训练管道。 有关设计器的引导式简介,请完成设计器教程的第一部分

重要

如果看不到本文档中提到的图形元素(例如工作室或设计器中的按钮),则你可能没有适当级别的工作区权限。 请与 Azure 订阅管理员联系,验证是否已向你授予正确级别的访问权限。 有关详细信息,请参阅管理用户和角色

创建批量推理管道

必须至少运行一次训练管道,才能创建推理管道。

  1. 转到工作区中的“设计器”选项卡。

  2. 选择训练管道,将使用它训练要用来进行预测的模型。

  3. “提交”管道。

Submit the pipeline

Screenshot showing the set up pipeline job with the experiment drop-down and submit button highlighted.

你将在画布左侧看到提交列表。 可以选择作业详细信息链接以转到作业详细信息页,在训练管道作业完成后,可以创建批量推理管道。

Screenshot showing the submitted job list.

  1. 在作业详细信息页中的画布上方,选择下拉菜单“创建推理管道”。 选择“批量推理管道”。

    注意

    目前,自动生成推理管道仅适用于完全由设计器内置组件生成的训练管道。

    它将为你创建批量推理管道草稿。 批量推理管道草稿将训练管道作业中已训练的模型用作 MD- 节点,并将转换用作 TD- 节点。

    你还可以修改此推理管道草稿以更好地处理输入数据,从而进行批量推理。

添加管道参数

要创建对新数据的预测,可以手动连接此管道草稿视图中的不同数据集,也可以创建数据集的参数。 通过参数可以在运行时更改批量推理过程的行为。

在本节中,你将创建一个数据集参数,以便指定要进行预测的不同目标数据集。

  1. 选择数据集组件。

  2. 画布右侧将显示一个窗格。 在窗格底部,选择“设置为管道参数”。

    输入参数名称或接受默认值。

    Screenshot of cleaned dataset tab with set as pipeline parameter checked.

  3. 提交批量推理管道,并通过选择左侧窗格中的作业链接转到作业详细信息页。

发布批量推理管道

现已准备好部署推理管道。 下面的操作将部署管道,使其可供其他人使用。

  1. 选择“发布”按钮。

  2. 在出现的对话框中,展开“PipelineEndpoint”的下拉菜单,然后选择“新建 PipelineEndpoint”。

  3. 提供终结点名称和可选说明。

    在对话框底部附近,可以看到使用训练期间所用的数据集 ID 默认值配置的参数。

  4. 选择发布

Screenshot of set up published pipeline.

使用终结点

现在,你已有一个带数据集参数的已发布管道。 管道将使用在训练管道中创建的训练模型,对作为参数提供的数据集进行评分。

提交管道作业

在本部分中,你将设置手动管道作业,并修改管道参数以对新数据进行评分。

  1. 部署完成后,转到“终结点”部分。

  2. 选择“管道终结点”。

  3. 选择你创建的终结点的名称。

Screenshot of the pipeline endpoint tab.

  1. 选择“已发布管道”。

    此屏幕显示此终结点下的所有已发布管道。

  2. 选择已发布的管道。

    “管道详细信息”页显示管道的详细作业历史记录和连接字符串信息。

  3. 选择“提交”创建管道的手动运行。

    Screenshot of set up pipeline job with parameters highlighted.

  4. 更改参数以使用不同的数据集。

  5. 选择“提交”运行管道。

使用 REST 终结点

可以在“终结点”部分中找到有关如何使用管道终结点和已发布管道的信息。

在“作业概述”面板中可以找到管道终结点的 REST 终结点。 调用终结点即会使用其默认的已发布管道。

另外,还可以在“已发布管道”页中使用已发布的管道。 选择一个已发布的管道,然后就可以在图右侧的“已发布管道概览”面板中找到该管道的 REST 终结点。

若要进行 REST 调用,你需要 OAuth 2.0 持有者类型的身份验证标头。 请参阅以下教程部分,以详细了解如何设置工作区的身份验证并进行参数化 REST 调用。

版本控制终结点

设计器将版本分配给你发布到终结点的每个后续管道。 可以在 REST 调用中指定要作为参数执行的管道版本。 如果不指定版本号,设计器将使用默认管道。

在发布管道时,可以选择将其设为该终结点的新默认管道。

Screenshot of set up published pipeline with set as default pipeline for this endpoint checked.

另外,还可以在终结点的“已发布管道”选项卡中设置新的默认管道。

Screenshot of sample pipeline tab with set as default highlighted.

更新管道终结点

如果你在训练管道中进行了一些修改,那么你可能希望将新训练的模型更新到管道终结点。

  1. 在修改后的训练管道成功完成后,转到作业详细信息页。

  2. 右键单击“训练模型”组件并选择“注册数据”

    Screenshot of the train model component options with register data highlighted.

    输入名称,然后选择“文件类型”。

    Screenshot of register as data asset with new data asset selected.

  3. 找到之前的批量推理管道草稿,或者可以将已发布的管道克隆到新的草稿中。

  4. 将推理管道草稿中的 MD- 节点替换为上述步骤中注册的数据。

    Screenshot of updating the inference pipeline draft with the registered data in the step above.

  5. 更新数据转换节点 TD- 与更新已训练的模型相同。

  6. 然后,可以提交模型和转换均已更新的推理管道,并再次发布。

后续步骤

  • 按照设计器教程训练和部署回归模型。
  • 若要了解如何使用 SDK v1 来发布管道以及运行已发布的管道,请参阅如何部署管道一文。