使用 Delta Sharing 开放共享协议共享数据(针对提供者)

本文概述了提供者如何使用 Delta Sharing 开放共享协议与任何位置的任何计算平台上的任何用户共享已启用 Unity Catalog 的 Azure Databricks 工作区中的数据。

注意

如果你是数据接收者(正在与其共享数据的用户或用户组),请参阅使用 Delta Sharing 访问与你共享的数据(适用于接收者)

谁应该使用 Delta Sharing 开放共享协议?

有 3 种方法来使用 Delta Sharing 共享数据:

  1. Databricks 开放共享协议(参见本文),它让你能够与任何计算平台上的用户共享你在启用了 Unity Catalog 的 Databricks 工作区中管理的数据。

    此方法使用 Azure Databricks 中内置的 Delta Sharing 服务器。当你使用 Unity Catalog 管理数据并希望与不使用 Databricks 或无权访问支持 Unity Catalog 的 Databricks 工作区的用户共享数据时,此方法非常有用。 与提供者端的 Unity Catalog 的集成简化了提供者的设置和管理。

  2. 开源 Delta Sharing 服务器的客户管理的实现,它让你能够在任何平台之间进行共享(无论是否是 Databricks)。

    请参阅 github.com/delta-io/delta-sharing

  3. Databricks 到 Databricks 共享协议,它让你能够将你启用了 Unity Catalog 的工作区中的数据与也有权访问已启用 Unity Catalog 的 Databricks 工作区的用户进行共享。

    请参阅使用 Delta Sharing Databricks 到 Databricks 协议共享数据(针对提供者)

有关 Delta Sharing 的简介以及这三种方法的相关详细信息,请参阅什么是 Delta Sharing?

Delta Sharing 开放共享工作流

本部分提供开放共享工作流的大致概述,并提供每个步骤的详细文档链接。

在 Delta Sharing 开放共享模型中:

  1. 数据提供程序会创建一个收件人,该收件人是一个命名对象,表示数据提供程序要与之共享数据的用户或用户组。

    数据提供程序创建收件人时,Azure Databricks 会生成令牌、包含令牌的凭据文件,以及一个激活链接,数据提供程序可以将该链接发送给收件人以访问该凭据文件。

    有关详细信息,请参阅 步骤 1:创建收件人

  2. 数据提供程序创建一个共享,该共享是一个命名对象,包含在提供程序帐户的 Unity Catalog 元存储中注册的表的集合。

    有关详细信息,请参阅创建和管理 Delta Sharing 的共享

  3. 数据提供程序为接收者授予对共享的访问权限。

    有关详细信息,请参阅管理对 Delta Sharing 数据共享的访问权限(适用于提供者)

  4. 数据提供程序通过安全通道向收件人发送激活链接,以及有关使用激活链接下载凭据文件的说明,收件人将使用该文件与数据提供程序建立安全连接以接收共享数据。

    有关详细信息,请参阅步骤 2:获取激活链接

  5. 数据收件人按照激活链接下载凭据文件,然后使用凭据文件访问共享数据。

    共享数据是只读的。 用户可以使用其选择的平台或工具访问数据。

    有关详细信息,请参阅读取使用 Delta Sharing 开放共享共享的数据(针对接收者)

开放共享的设置和安全注意事项

使用开放共享模型时,良好的令牌管理是安全共享数据的关键:

数据提供程序可以通过指定 IP 访问列表来限制收件人访问特定的网络位置,从而提供额外的安全性。 请参阅使用 IP 访问列表限制 Delta Sharing 接收者访问权限(开放共享)