管理 Unity Catalog 元存储
本文介绍如何在 Azure Databricks 帐户中更新、删除和管理 Unity Catalog 元存储的行为。
若要了解 Unity Catalog 元存储及其创建方法,请参阅创建 Unity Catalog 元存储。
启用自动分配给新工作区的元存储
若要自动将现有 Unity Catalog 元存储分配给该元存储区域中的新工作区,帐户管理员可以为元存储启用工作区自动分配。 如果未选择此设置,则在与元存储相同的区域中创建工作区的管理员必须手动为 Unity Catalog 启用工作区,并从下拉列表中选择元存储。
在帐户管理员启用此选项之前,应确保了解以下对新工作区的影响:
- 将创建工作区目录,所有工作区用户都将拥有在其中创建对象所需的特权。 请参阅 Unity Catalog 的自动启用。
- 工作区管理员将具有创建元存储级安全对象(如目录和外部位置)所需的权限。 请参阅《为 Unity Catalogu 自动启用工作区时的工作区管理员权限》。
- 如果已为元存储启用元存储级别存储,则工作区将能够使用该存储。 请参阅在 Unity Catalog 中指定托管存储位置。
- 如果为元存储定义了元存储管理员,则它们将能够管理对附加到元存储的所有工作区中所有安全对象的访问权限。 请参阅元存储管理员。
- 元存储的增量共享设置(已启用或已禁用)将应用于附加到元存储的所有工作区。 请参阅为帐户设置 Delta Sharing(针对提供商)。
若要启用自动分配,请执行以下操作:
- 以帐户管理员身份登录到 Azure Databricks 帐户控制台。
- 单击 “目录”。
- 选择元存储。
- 在“配置”选项卡上的“工作区分配”下,选择“自动将
<region>
中的新工作区分配到此元存储”。 - 在确认对话框中,单击“启用自动分配”。
将托管存储添加到现有元存储
元存储级托管存储是可选的,对于自动创建的元存储,将不包含该托管存储。 如果希望使用数据隔离模型来为多个工作区集中存储数据,可能需要将元存储级别存储添加到元存储。 如果你要使用 Delta Sharing 共享笔记本,或者如果你是使用个人暂存位置的 Azure Databricks 合作伙伴,则需要元存储级别的存储。
还可以参阅在 Unity Catalog 中指定托管存储位置。
要求
- 必须至少有一个工作区附加到 Unity Catalog 元存储。
- 所需的 Azure Databricks 权限:
- 若要创建外部位置,你必须是元存储管理员或具有
CREATE EXTERNAL LOCATION
和CREATE STORAGE CREDENTIAL
权限的用户。 - 若要将存储位置添加到元存储定义,你必须是帐户管理员。若要了解如何在帐户中启用帐户管理员角色,请参阅建立第一个帐户管理员。
- 若要创建外部位置,你必须是元存储管理员或具有
- 所需的 Azure 租户权限:
- 创建用于 Azure Data Lake Storage Gen2 的存储帐户的权限。 此存储帐户必须有分层命名空间。 请参阅创建用于 Azure Data Lake Storage Gen2 的存储帐户。
- 创建用于保存系统分配的托管标识的新资源的权限。 这要求你是租户中任何订阅中的资源组的参与者或所有者。
步骤 1:创建存储位置
按照步骤 1(可选):为元存储级托管存储创建存储容器和步骤 2(可选):创建托管标识以访问托管存储位置中的说明,在 Azure Data Lake Storage Gen2 中创建一个存储容器,并创建一个 Azure Databricks 访问连接器来保存有权访问存储容器的托管标识。
步骤 2:在 Unity Catalog 中创建外部位置
在此步骤中,你将在 Unity Catalog 中创建一个外部位置,该位置引用你刚刚创建的 ADLS Gen 2 路径。
创建存储凭据。
存储凭据将表示在步骤 1:创建存储位置中创建的 Azure 托管标识。
按照创建存储凭据以连接到 Azure Data Lake Storage Gen2 中的说明操作。
创建一个外部位置,该位置引用在上一步中创建的存储凭据和在步骤 1:创建存储位置中创建的 ADLS Gen 2 存储容器。
按照创建外部位置以将云存储连接到 Azure Databricks 中的说明操作
向自己授予对外部位置的
CREATE MANAGED STORAGE
权限。- 单击外部位置名称以打开详细信息窗格。
- 在“权限”选项卡上,单击“授权”。
- 在“在
<external location>
上授予”对话框中,在“主体”字段中选择你自己,然后选择“CREATE MANAGED STORAGE
”。 - 单击“授予”。
步骤 3:将存储位置添加到元存储
创建表示元存储存储桶的外部位置后,可以将其添加到元存储。
作为帐户管理员,登录到帐户控制台。
单击 “目录”。
单击元存储名称。
确认你是元存储管理员。
如果你不是,请单击“编辑”,并将你自己分配为元存储管理员。完成此过程后,可以取消分配你自己。
在“配置”选项卡上,在“ADLS Gen 2 路径”旁边单击“设置”。
在“设置元存储根”对话框中,输入用于创建外部位置的 ADLS Gen 2 路径,然后单击“更新”。
此路径一旦设置便无法修改。
添加元存储管理员
元存储管理员是可选的,但在某些情况下,你可能想要为元存储设置一个管理员。 请参阅分配元存储管理员。
删除元存储
如果要关闭 Azure Databricks 帐户,或者有其他原因需要删除对 Unity Catalog 元存储管理的数据的访问权限,则可以删除该元存储。
警告
使用 Azure Databricks 工作区时,由元存储管理的所有对象都将变得不可访问。 此操作不可撤消。
托管表数据和元数据将在 30 天后自动删除。 云存储中的外部表数据不受元存储删除的影响。
删除元存储:
- 作为元存储管理员,登录到帐户控制台。
- 单击 “目录”。
- 单击元存储名称。
- 在“配置”选项卡上,单击右上角的三个按钮菜单,然后选择“删除”。
- 在确认对话框中,输入元存储的名称,然后单击“删除”。