恢复软删除的工作区数据
Azure 机器学习工作区的软删除功能提供了数据保护功能,用于在意外删除后尝试恢复工作区数据。 软删除引入了删除工作区的两步法。 删除工作区时,会首先软删除该工作区。 处于软删除状态时,可以在数据保持期内选择恢复或永久删除工作区及其数据。
工作区软删除的工作原理
软删除工作区时,服务端存储的数据和元数据将被软删除,但某些配置将被硬删除。 下表概述了哪些配置和对象会被软删除,哪些会被硬删除。
数据/配置 | 已软删除 | 已硬删除 |
---|---|---|
运行历史记录 | ✓ | |
模型 | ✓ | |
数据 | ✓ | |
环境 | ✓ | |
组件 | ✓ | |
笔记本 | ✓ | |
管道 | ✓ | |
设计器管道 | ✓ | |
AutoML 作业 | ✓ | |
数据标签项目 | ✓ | |
数据存储 | ✓ | |
已排队或正在运行的作业 | ✓ | |
角色分配 | ✓* | |
内部缓存 | ✓ | |
计算实例 | ✓ | |
计算群集 | ✓ | |
推理终结点 | ✓ | |
链接的 Databricks 工作区 | ✓* |
* 恢复工作区时,Microsoft 会尝试重新创建或重新附加。无法保证可以恢复,但会尽最大努力尝试。
软删除后,服务会在恢复保持期内保留必要的数据和元数据。 当保持期到期或永久删除工作区后,数据和元数据将被主动删除。
软删除保留期
对于已删除的工作区,默认保持期为 14 天。 保持期表示工作区数据在删除后保持可用的时间。 保持期从工作区被软删除的那一刻开始计算。
在保持期内,可以恢复或永久删除已软删除的工作区。 针对工作区的任何其他操作(例如提交训练作业)都将失败。
重要
在保持期已过或工作区被永久删除之前,不能重复使用已软删除的工作区的名称。 保持期过后,软删除的工作区将自动被永久删除。
删除工作区
删除工作区时,默认的删除行为是软删除。 (可选)可以通过永久删除工作区来替代软删除行为。 永久删除工作区可确保立即删除工作区数据。 使用此选项以满足相关的合规性要求,或者当需要在删除后立即重用工作区名称时使用此选项。 替代默认行为在需要创建工作区,随后又删除工作区的开发/测试方案中可能很有用。
从 Azure 门户删除工作区时,勾选“永久删除工作区”。 一次只能永久删除一个工作区,不能使用批处理操作。
提示
v1 SDK 和 CLI 不提供替代默认软删除行为的功能。 若要替代 SDK 或 CLI 中的默认行为,请使用 v2 版本。 有关详细信息,请参阅 CLI 和 SDK v2 一文或本文的 v2 版本。
如果使用 Azure 机器学习 SDK 或 CLI,则可以设置 permanently_delete
标志。
from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential
ml_client = MLClient(
DefaultAzureCredential(),
subscription_id="<SUBSCRIPTION_ID>",
resource_group_name="<RESOURCE_GROUP>"
)
result = ml_client.workspaces.begin_delete(
name="myworkspace",
permanently_delete=True,
delete_dependent_resources=False
).result()
print(result)
永久删除后,将无法再恢复工作区数据。 软删除保持期到期时,也会触发工作区数据的永久删除。
管理软删除的工作区
可以在 Azure 门户的 Azure 机器学习资源提供程序下管理已软删除的工作区。 若要列出已软删除的工作区,请遵循以下步骤:
在 Azure 门户中,选择“更多服务”。 在“AI + 机器学习”类别中选择“Azure 机器学习”。
在页面顶部,选择“最近删除”,查看已软删除且仍在保持期内的工作区。
在“最近删除的工作区”视图中,可以恢复或永久删除工作区。
恢复软删除的工作区
在已软删除的工作区上选择“恢复”时,会启动还原工作区状态的操作。 该服务会尝试重新创建或重新附加一部分资源,包括 Azure RBAC 角色分配。 必需重新创建硬删除的资源(包括计算群集)。
Azure 机器学习会恢复工作区标识的 Azure RBAC 角色分配,但不会恢复你在工作区上添加的角色分配。 在工作区恢复后,角色分配最多可能需要 15 分钟来传播。
并非总是能够恢复工作区。 Azure 机器学习将工作区元数据存储在与工作区关联的其他 Azure 资源上。 如果删除了这些依赖的 Azure 资源,则可能会阻碍恢复或正确还原工作区。 必须先恢复 Azure 机器学习工作区的依赖项,然后才能恢复已删除的工作区。 下表概述了 Azure 机器学习工作区的每个依赖项的恢复选项。
依赖项 | 恢复方法 |
---|---|
Azure Key Vault | 恢复删除的 Azure Key Vault 实例 |
Azure 存储 | 恢复删除的 Azure 存储帐户。 |
Azure 容器注册表 | Azure 容器注册表不是工作区恢复的硬性要求。 Azure 机器学习可以为自定义环境重新生成映像。 |
Azure Application Insights | 首先,恢复 Log Analytics 工作区。 然后使用原始名称重新创建应用程序见解。 |
计费影响
通常,当工作区处于软删除状态时,仅可执行两种操作:“永久删除”和“恢复”。 所有其他操作都会失败。 因此,即使工作区存在,也不可执行任何计算操作,因此不会出现使用情况。 软删除工作区时,任何产生成本的资源(包括计算群集)都将被硬删除。
重要
使用客户管理的密钥进行加密的工作区将其他服务数据存储在订阅中的托管资源组中。 软删除工作区时,不会删除受管理资源组及其中的资源,并且会产生费用,直至硬删除工作区。
一般数据保护条例 (GDPR) 含义
软删除后,服务会在恢复保持期内保留必要的数据和元数据。 从 GDPR 和隐私的角度来看,请求删除个人数据应被理解为请求“永久”删除工作区,而不是软删除。
当保持期到期或永久删除工作区后,数据和元数据将被主动删除。 可以在删除时选择永久删除工作区。
有关详细信息,请参阅导出或删除工作区数据一文。