什么是Azure Machine Learning工作区?

工作区是与同事协作创建机器学习工件并组织相关工作的地方。 例如,试验、作业、数据集、模型、组件和推理终结点。 本文介绍了工作区、如何管理对工作区的访问权限,以及如何使用工作区来组织工作。

准备好开始了吗? 创建工作区

在工作区中执行的任务

对于machine learning团队,工作区是组织工作的地方。 下面是可从工作区开始的一些任务:

  • 创建作业–作业是用于构建模型的训练作业。 可以将作业分组到试验中以比较指标。
  • Author pipelines - Pipelines是用于训练和重新训练模型的可重用工作流。
  • 注册数据资产–数据资产有助于管理用于模型训练和管道创建的数据。
  • 注册模型–有了要部署的模型后,需要创建一个已注册的模型。
  • 部署模型–使用已注册的模型和评分脚本部署模型。

除了对机器学习结果进行分组外,工作区同时也管理资源配置:

  • 计算目标用于运行试验。
  • 数据存储定义你和其他人在使用数据资产时如何连接到数据源。
  • 安全设置 - 网络、标识、访问控制和加密设置。

整理工作区

对于机器学习团队的负责人和管理员,工作区充当用于访问管理、成本管理和数据隔离的容器。 下面是组织工作区的一些提示:

  • 使用 用户角色 管理用户之间的工作区中的权限。 例如,将角色用于数据科学家、机器学习工程师或管理员。
  • 将访问权限分配给用户组:通过使用 Microsoft Entra 用户组,无需将单个用户添加到每个工作区。 使用相同的用户组授予其他资源访问权限。
  • 为每个项目创建工作区:虽然一个工作区可以用于多个项目,但将其限制为每个工作区对应一个项目,可以让成本报告具体到项目级别。 它还允许您在每个项目的范围内管理数据存储等配置。
  • 共享Azure资源:工作区需要创建多个关联资源。 在工作区之间共享这些资源,以保存重复的设置步骤。
  • 启用自助服务:以 IT 管理员身份预先创建和保护关联的资源,并使用用户角色让数据科学家自行创建工作区。
  • 共享资产:可以使用 Azure Machine Learning 注册表在工作区之间共享资产。
  • 使用中心工作区进行集中治理hub 工作区将多个项目工作区分组,并共享安全设置、连接和计算资源。 中心工作区与 Microsoft Foundry 中心的资源类型相同,因此可以从 Azure Machine Learning studio 和 Foundry 使用它们。

我的内容是如何存储在工作区中的?

工作区保留所有训练运行的历史记录,包括日志、指标、输出、世系元数据和脚本快照。 在Azure Machine Learning中执行任务时,将生成工件。 它们的元数据和数据存储在工作区及其关联的资源中。

关联的资源

创建新工作区时,必须引入其他Azure资源来存储数据。 如果未提供这些资源,Azure Machine Learning会自动创建它们。

  • Azure Storage 帐户。 存储机器学习工件,例如作业日志。 默认情况下,在上传数据时,工作区会使用这个存储帐户。 你用于Azure Machine Learning计算实例的 Jupyter 笔记本也存储在此处。

    重要

    不能使用现有的Azure Storage帐户(如果为:

    • BlobStorage 类型的帐户
    • 高级帐户(Premium_LRS 和 Premium_GRS)
    • 具有分层命名空间的帐户(与Azure Data Lake Storage Gen2一起使用)。

    创建数据存储,可以将高级存储或分层命名空间用作额外的存储。

    升级到常规用途 v2 后,不要在 storage 帐户上启用分层命名空间。

    如果使用现有的常规用途 v1 storage 帐户,可以在创建工作区后将其升级到常规用途 v2。适用于:Azure CLI ml extension v2(current)Python SDK azure-ai-ml v2(current)

  • Azure Container Registry (ACR)。 在使用 Azure Machine Learning 构建自定义环境时,存储被创建的 docker 容器。 部署 AutoML 模型和数据配置文件会触发自定义环境的创建。

    如果不需要生成自定义 Docker 容器,可以 创建不依赖 ACR 的工作区。 Azure Machine Learning可以从外部容器注册表读取。

    生成自定义 Docker 映像时,会自动预配 ACR。 使用Azure基于角色的访问控制(Azure RBAC)防止构建客户 docker 容器。

    重要

    如果你的订阅设置需要将标记添加到其下的资源,则由Azure Machine Learning创建的 ACR 会失败,因为我们无法将标记设置为 ACR。

  • Azure Application Insights。 帮助你监视和收集推理终结点中的诊断信息。

    有关更多信息,请参阅在线端点监控

  • Azure Key Vault。 存储使用计算目标以及工作区所需的其他敏感信息的机密。

创建工作区

可以通过多种方式创建工作区。 若要开始,请使用以下选项之一:

若要使用你的首选安全设置自动创建工作区,请执行以下操作:

  • Azure Resource Manager/Bicep 模板提供声明性语法来部署Azure资源。 另请参阅 Bicep 模板Terraform 模板

  • 使用 Azure Machine Learning CLI v1Azure Machine Learning SDK v1 for Python 进行原型制作,并将其用作 MLOps 工作流的一部分。

    重要

    本文提供有关使用 Azure Machine Learning SDK v1 的信息。 SDK v1 自 2025 年 3 月 31 日起弃用。 对它的支持将于 2026 年 6 月 30 日结束。 可以在该日期之前安装和使用 SDK v1。 使用 SDK v1 的现有工作流将在支持结束日期后继续运行。 但是,在产品发生体系结构更改时,可能会面临安全风险或中断性变更。

    建议在 2026 年 6 月 30 日之前过渡到 SDK v2。 有关 SDK v2 的详细信息,请参阅 什么是 Azure Machine Learning CLI 和 Python SDK v2?SDK v2 参考

    重要

    本文中的某些Azure CLI命令使用 Azure Machine Learning azure-cli-ml 或 v1 扩展。 对 CLI v1 的支持于 2025 年 9 月 30 日结束。 Microsoft将不再为此服务提供技术支持或更新。 使用 CLI v1 的现有工作流将继续在支持终止日期后运行。 但是,在产品发生体系结构更改时,可能会面临安全风险或中断性变更。

    建议尽快过渡到 mlv2 扩展。 有关 v2 扩展的详细信息,请参阅 Azure Machine Learning CLI 扩展和 Python SDK v2

  • 直接在脚本环境或 MLOps 工作流中使用 REST API 进行平台集成。

用于工作区交互和管理的工具

设置工作区后,可以通过以下方式与之交互:

  • 在 Web 上:
  • 在任何具有 Azure Machine Learning SDK v1 的 Python 环境中

    重要

    本文提供有关使用 Azure Machine Learning SDK v1 的信息。 SDK v1 自 2025 年 3 月 31 日起弃用。 对它的支持将于 2026 年 6 月 30 日结束。 可以在该日期之前安装和使用 SDK v1。 使用 SDK v1 的现有工作流将在支持结束日期后继续运行。 但是,在产品发生体系结构更改时,可能会面临安全风险或中断性变更。

    建议在 2026 年 6 月 30 日之前过渡到 SDK v2。 有关 SDK v2 的详细信息,请参阅 什么是 Azure Machine Learning CLI 和 Python SDK v2?SDK v2 参考

  • 在命令行内使用 Azure Machine Learning CLI 扩展 v1

    重要

    本文中的某些Azure CLI命令使用 Azure Machine Learning azure-cli-ml 或 v1 扩展。 对 CLI v1 的支持于 2025 年 9 月 30 日结束。 Microsoft将不再为此服务提供技术支持或更新。 使用 CLI v1 的现有工作流将继续在支持终止日期后运行。 但是,在产品发生体系结构更改时,可能会面临安全风险或中断性变更。

    建议尽快过渡到 mlv2 扩展。 有关 v2 扩展的详细信息,请参阅 Azure Machine Learning CLI 扩展和 Python SDK v2

  • Azure Machine Learning VS Code 扩展

每个接口提供以下工作区管理任务。

工作区管理任务 Portal 工作室 Python SDK Azure CLI VS Code
创建工作区
管理工作区访问
创建和管理计算资源
创建计算实例

警告

无法将Azure Machine Learning工作区移动到其他订阅。 也不能将拥有的订阅移动到新租户。 这些操作可能会导致错误。

子资源

在 Azure Machine Learning 中创建计算群集和计算实例时,还会创建子资源。

  • VM:为计算实例和计算群集提供计算能力。 使用它们来运行任务。
  • 为每个计算实例和计算群集中创建网络负载均衡器。 即使计算实例或群集停止,它也会管理流量。
  • 虚拟网络:虚拟网络可帮助 Azure 资源彼此通信、与互联网以及其他本地网络通信。
  • 带宽:涵盖跨区域的所有出站数据传输。

后续步骤

若要详细了解如何规划组织的工作区要求,请参阅 Organize 并设置 Azure Machine Learning

若要开始使用 Azure Machine Learning,请参阅: