导出或删除机器学习服务工作区数据 (v1)
在 Azure 机器学习中,可以使用门户的图形界面或 Python SDK 来导出或删除工作区数据。 本文介绍这两种选项。
注意
有关查看或删除个人数据的信息,请参阅 GDPR 的 Azure 数据使用者请求。 有关 GDPR 的详细信息,请参阅 Microsoft 信任中心的 GDPR 部分和服务信任门户的 GDPR 部分。
注意
本文介绍如何删除设备或服务中的个人数据,并且可用于为 GDPR 下的义务提供支持。 有关 GDPR 的常规信息,请参阅 Microsoft 信任中心的 GDPR 部分和服务信任门户的 GDPR 部分。
控制工作区数据
Azure 机器学习存储的产品内数据可用于导出和删除。 可以使用 Azure 机器学习工作室、CLI 和 SDK 进行导出和删除。 可通过 Azure 隐私门户访问遥测数据。
在 Azure 机器学习中,个人数据包括作业历史记录文档中的用户信息。
使用门户删除高级资源
创建工作区时,Azure 在资源组中创建若干资源:
- 工作区本身
- 一个存储帐户
- 容器注册表
- Application Insights 实例
- 密钥保管库
可以从列表选择这些资源,然后选择“删除”将它们删除
作业历史记录文档(其中可能包含个人用户信息)存储在 Blob 存储的存储帐户的 /azureml
的子文件夹。 可以从门户下载并删除数据。
使用 Azure 机器学习工作室导出和删除机器学习资源
Azure 机器学习工作室提供机器学习资源(如笔记本、数据集、模型和试验)的统一视图。 Azure 机器学习工作室强调保存数据和试验的记录。 可以使用浏览器删除计算性资源(如管道和计算资源)。 对于这些资源,导航到相关资源并选择“删除”。
可以取消注册数据集,并且可以存档试验,但这些操作不删除数据。 若要完全删除数据,必须在存储级别删除数据集和试验数据。 如前文所述,使用门户在存储级别完成删除。 可以直接在工作室中删除单个作业。 删除作业会删除作业的数据。
注意
在取消注册数据集之前,使用其“数据源”链接查找要删除的特定数据 URL。
可以使用工作室从试验性作业下载训练项目。 选择感兴趣的“试验”和“作业”。 选择“输出 + 日志”并导航到要下载的特定项目。 选择“...”和“下载”。
可以通过导航到“模型”并选择“下载”来下载已注册的模型 。
使用 Python SDK 导出和删除资源
可以使用以下内容来下载特定作业的输出:
# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')
metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)
可以使用 Python SDK 删除以下机器学习资源:
类型 | 函数调用 | 说明 |
---|---|---|
Workspace |
delete |
使用 delete-dependent-resources 来级联删除 |
Model |
delete |
|
ComputeTarget |
delete |
|
WebService |
delete |