在 Microsoft Purview 中连接并管理 Azure 机器学习(预览版)

本文概述如何在 Microsoft Purview 中注册 Azure 机器学习,以及如何向 Azure 机器学习进行身份验证并与之交互。 有关 Microsoft Purview 的详细信息,请阅读简介文章

Azure 机器学习与 Microsoft Purview 之间的这种集成应用了一种自动推送模型,即在 Microsoft Purview 中注册了 Azure 机器学习工作区后,工作区中的元数据就会每天自动推送到 Microsoft Purview。 无需手动扫描即可将元数据从工作区引入 Microsoft Purview。

重要

此功能目前以预览版提供。 Azure 预览版的补充使用条款包含适用于 beta 版、预览版或其他尚未正式发布的 Azure 功能的其他法律条款。

支持的功能

元数据提取   完全扫描  增量扫描 限定范围扫描 分类 访问策略 沿袭
No No

扫描 Azure 机器学习源时,Microsoft Purview 支持:

  • 从 Azure 机器学习中提取技术元数据,包括:
    • 工作区
    • 模型
    • 数据集
    • 作业

注意

  1. AML 工作区目前不支持通过专用终结点将元数据推送到 Microsoft Purview。
  2. 你必须在 AML 工作区中注册资产,然后才能在 Microsoft Purview 中显示这些资产。

先决条件

  • 你的 Azure 帐户必须具有有效订阅。 创建帐户

  • 你必须具有有效的 Microsoft Purview 帐户

  • 需要拥有数据源管理员和数据读取者权限才能在 Microsoft Purview 治理门户中注册和管理源。 有关权限的详细信息,请参阅 Microsoft Purview 中的访问控制

  • 一个活动的 Azure 机器学习工作区

  • 用户需要 Azure 机器学习工作区中的“参与者”角色才能启用从 Azure 机器学习工作区自动推送。

注册

本部分介绍如何使用 Microsoft Purview 治理门户在 Microsoft Purview 中注册 Azure 机器学习工作区。

  1. 转到你的 Microsoft Purview 帐户。

  2. 在左侧窗格中选择“数据映射”。

  3. 选择“注册”。

  4. 在“注册源”中,选择“Azure 机器学习(预览版)”>“继续”。

    Screenshot of the Azure Machine Learning source entry.

  5. 在“注册源(Azure 机器学习)”屏幕上,执行以下操作:

    1. 对于“名称”,请输入一个 Microsoft Purview 列为工作区数据源的易记名称。

    2. 对于“Azure 订阅”和“工作区名称”,请从下拉列表中选择要推送的订阅和工作区。 Azure 机器学习工作区 URL 会自动填充。

    3. 从列表中选择连接。

  6. 选择“注册”以注册源。   

扫描

注册 Azure 机器学习工作区后,元数据将每天自动推送到 Microsoft Purview。

浏览和发现

若要从 Azure 机器学习工作区访问数据资产的浏览体验,请选择“浏览资产”。

Screenshot of the browse assets selection.

按集合浏览

按集合浏览可以浏览你充当其数据读取者或管护者的不同集合。

Screenshot of browsing by collection.

按源类型浏览

  1. 在“按源类型浏览”页上,选择“Azure 机器学习”。

    Screenshot of the Azure Machine Learning source type.

  2. 会列出所选数据类型下最高级别的资产。 请选取这些资产中的某一个,以进一步浏览其内容。 例如,在选择“Azure 机器学习”后,可看到包含数据目录中的资产的工作区列表。

    Screenshot of the top level assets.

  3. 选择其中一个工作区会显示子资产。

    Screenshot of child assets.

  4. 从列表中,可以选择任何资产项以查看详细信息。 例如,选择其中一个 Azure 机器学习作业资产会显示该作业的详细信息。

    Screenshot of asset details.

沿袭

若要查看世系信息,请选择一个资产,然后选择“世系”选项卡。在世系选项卡中,可以看到资产的关系(如果适用)。 可以看到使用了哪些源数据(如果在 Purview 中注册)、在 Azure 机器学习中创建的数据资产、任何作业,以及最后生成的机器学习模型。 在更高级的方案中,可以看到:

  • 是否使用了多个数据源
  • 针对多个数据资产的多个训练阶段
  • 是否从同一数据源创建了多个模型

Screenshot of the asset lineage.

若要详细了解世系的常规信息,请参阅数据世系世系用户指南

后续步骤

现在你已经注册了源,请按照以下指南来详细了解 Microsoft Purview 和你的数据: