在 Azure 机器学习中附加和管理 Synapse Spark 池

适用范围:Azure CLI ml 扩展 v2(最新版)Python SDK azure-ai-ml v2(最新版)

本文介绍如何在 Azure 机器学习中附加 Synapse Spark 池。 可以通过以下方式之一在 Azure 机器学习中附加 Synapse Spark 池:

  • 使用 Azure 机器学习工作室 UI
  • 使用 Azure 机器学习 CLI
  • 使用 Azure 机器学习 Python SDK

先决条件

在 Azure 机器学习中附加 Synapse Spark 池

Azure 机器学习提供了用于附加和管理 Synapse Spark 池的多个选项。

若要使用工作室“计算”选项卡附加 Synapse Spark 池:

Screenshot showing creation of a new Synapse Spark Pool.

  1. 在左侧窗格中的“管理”部分,选择“计算”。
  2. 选择“附加的计算”。
  3. 在“附加的计算”屏幕上,选择“新建”以查看用于附加不同类型的计算的选项。
  4. 选择“Synapse Spark 池”。

“附加 Synapse Spark 池”面板将在屏幕右侧打开。 在此面板中:

  1. 输入一个名称,该名称对应的是 Azure 机器学习中附加的 Synapse Spark 池。

  2. 从下拉菜单中选择一个 Azure 订阅。

  3. 从下拉菜单中选择一个 Synapse 工作区。

  4. 从下拉菜单中选择一个 Spark 池。

  5. 切换“分配托管标识”选项以启用它。

  6. 选择要与此附加的 Synapse Spark 池一起使用的托管标识类型。

  7. 选择“更新”,完成 Synapse Spark 池附加过程。

在 Azure Synapse Analytics 中添加角色分配

若要确保附加的 Synapse Spark 池正常工作,请从 Azure Synapse Analytics 工作室 UI 为其分配管理员角色。 以下步骤显示如何执行此操作:

  1. 在 Azure 门户中打开 Synapse 工作区。

  2. 在左窗格中,选择“概述”。

    Screenshot showing Open Synapse Studio.

  3. 选择“打开 Synapse Studio”。

  4. 在 Azure Synapse Analytics 工作室中,选择左窗格中的“管理”。

  5. 在左窗格的“安全性”部分中选择“访问控制”(左起第二个)。

  6. 选择 添加

  7. 随后会在屏幕右侧打开“添加角色分配”面板。 在此面板中:

    1. 为“范围”选择“工作区项”。

    2. 在“项目类型”下拉菜单中,选择“Apache Spark 池”。

    3. 在“项”下拉菜单中,选择你的 Apache Spark 池。

    4. 在“角色”下拉菜单中,选择“Synapse 管理员”。

    5. 在“选择用户”搜索框中,开始键入 Azure 机器学习工作区的名称。 它会为你显示附加的 Synapse Spark 池的列表。 从列表中选择所需的 Synapse Spark 池。

    6. 选择“应用”。

      Screenshot showing Add Role Assignment.

更新 Synapse Spark 池

可以从 Azure 机器学习工作室 UI 管理附加的 Synapse Spark 池。 Spark 池管理功能包括附加的 Synapse Spark 池的相关托管标识更新。 可以在更新 Synapse Spark 池时分配系统分配的标识或用户分配的标识。 在将用户分配的托管标识分配给 Synapse Spark 池之前,应在 Azure 门户中创建一个用户分配的托管标识

若要更新附加的 Synapse Spark 池的托管标识:

Screenshot showing Synapse Spark Pool managed identity update.

  1. 在 Azure 机器学习工作室中打开 Synapse Spark 池的“详细信息”页。

  2. 找到位于“托管标识”部分右侧的编辑图标。

  3. 若要首次分配托管标识,请切换“分配托管标识”以启用它。

  4. 若要分配系统分配的托管标识:

    1. 选择“系统分配”作为“标识类型”。
    2. 选择“更新”。
  5. 若要分配用户分配的托管标识:

    1. 选择“用户分配”作为“标识类型”。
    2. 从下拉菜单中选择一个 Azure 订阅。
    3. 在显示文本“按名称搜索”的框中键入用户分配的托管标识名称的前几个字母。 此时会显示具有匹配的用户分配的托管标识名称的列表。 从该列表中选择所需的用户分配的托管标识。 可以选择多个用户分配的托管标识,并将其分配给附加的 Synapse Spark 池。
    4. 选择“更新”。

分离 Synapse Spark 池

我们可能需要分离附加的 Synapse Spark 池,以清理工作区。


Azure 机器学习工作室 UI 还提供了一种用于分离附加的 Synapse Spark 池的方法。 请按照下列步骤完成此操作:

  1. 在 Azure 机器学习工作室中打开 Synapse Spark 池的“详细信息”页。

  2. 选择“分离”以分离附加的 Synapse Spark 池。

Azure 机器学习中的无服务器 Spark 计算

在提交 Azure 机器学习作业期间,某些用户方案可能需要在无需附加 Spark 池的情况下访问无服务器 Spark 计算。 Azure Synapse Analytics 与 Azure 机器学习的集成还提供无服务器 Spark 计算体验。 这让用户能访问作业中的 Spark 池,而无需先将计算附加到工作区。 详细了解无服务器 Spark 计算体验

后续步骤