导出或删除机器学习服务工作区数据 (v1)

在 Azure 机器学习中,可以使用门户的图形界面或 Python SDK 来导出或删除工作区数据。 本文介绍这两种选项。

注意

有关查看或删除个人数据的信息,请参阅 GDPR 的 Azure 数据使用者请求。 有关 GDPR 的详细信息,请参阅 Microsoft 信任中心的 GDPR 部分服务信任门户的 GDPR 部分

注意

本文介绍如何删除设备或服务中的个人数据,并且可用于为 GDPR 下的义务提供支持。 有关 GDPR 的常规信息,请参阅 Microsoft 信任中心的 GDPR 部分服务信任门户的 GDPR 部分

控制工作区数据

Azure 机器学习存储的产品内数据可用于导出和删除。 可以使用 Azure 机器学习工作室、CLI 和 SDK 进行导出和删除。 可通过 Azure 隐私门户访问遥测数据。

在 Azure 机器学习中,个人数据包括作业历史记录文档中的用户信息。

使用门户删除高级资源

创建工作区时,Azure 在资源组中创建若干资源:

  • 工作区本身
  • 一个存储帐户
  • 容器注册表
  • Application Insights 实例
  • 密钥保管库

可以从列表选择这些资源,然后选择“删除”将它们删除

突出显示了“删除”图标的门户的屏幕截图

作业历史记录文档(其中可能包含个人用户信息)存储在 Blob 存储的存储帐户的 /azureml 的子文件夹。 可以从门户下载并删除数据。

门户中存储帐户内 azureml 目录的屏幕截图

使用 Azure 机器学习工作室导出和删除机器学习资源

Azure 机器学习工作室提供机器学习资源(如笔记本、数据集、模型和试验)的统一视图。 Azure 机器学习工作室强调保存数据和试验的记录。 可以使用浏览器删除计算性资源(如管道和计算资源)。 对于这些资源,导航到相关资源并选择“删除”。

可以取消注册数据集,并且可以存档试验,但这些操作不删除数据。 若要完全删除数据,必须在存储级别删除数据集和试验数据。 如前文所述,使用门户在存储级别完成删除。 可以直接在工作室中删除单个作业。 删除作业会删除作业的数据。

注意

在取消注册数据集之前,使用其“数据源”链接查找要删除的特定数据 URL。

可以使用工作室从试验性作业下载训练项目。 选择感兴趣的“试验”和“作业”。 选择“输出 + 日志”并导航到要下载的特定项目。 选择“...”和“下载”。

可以通过导航到“模型”并选择“下载”来下载已注册的模型 。

突出显示了“下载”选项的工作室模型页的屏幕截图

使用 Python SDK 导出和删除资源

可以使用以下内容来下载特定作业的输出:

# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')

metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)

可以使用 Python SDK 删除以下机器学习资源:

类型 函数调用 说明
Workspace delete 使用 delete-dependent-resources 来级联删除
Model delete
ComputeTarget delete
WebService delete