将数据引入 Lakeflow 设计器

Important

此功能目前以公共预览版提供。

本页介绍了在 Lakeflow 设计器中将数据导入到可视化数据准备区域的可选项。 设计器可以使用可通过Azure Databricks访问的任何数据。

设计器中的所有数据引入都以 Source 运算符开头。 打开源操作员的配置窗格时,可使用以下选项。

浏览现有表

单击“ 浏览现有 项”打开资产选择器,可在其中:

  • 浏览 Unity 目录中的表和卷。
  • 浏览工作区文件系统中的文件。

当数据已在Azure Databricks时使用此选项。

拖放本地文件

将 CSV 或Excel文件从本地计算机直接拖到画布上。 设计器将文件上传到工作区文件系统,并自动创建 Source 运算符。

注释

拖放Excel文件需要启用Excel文件格式支持。 请参阅 “读取 Excel 文件”。

从文件创建表

在“源配置”窗格中选择“从文件创建表”上传本地 CSV 或 Excel 文件,以此创建 Unity Catalog 表。 如果希望数据保留为托管表,而不是存储为工作区文件,请使用此选项。 此外,对于大量数据,这可提供最佳性能。

从 Google Drive 导入

从 Google Drive 导入文件:

  1. 在“源配置”窗格中,选择“ 从 Google Drive 导入”。
  2. 选择有权访问 Google Drive 的 Unity 目录连接。
  3. 提供文件 URL。

从 SharePoint 导入

若要从SharePoint导入文件,请执行以下操作:

  1. 在“源配置”窗格中,选择从 SharePoint 导入
  2. 选择有权访问你SharePoint网站的 Unity Catalog 连接。
  3. 提供 直接文件链接

警告

若要获取正确的 URL,请右键单击SharePoint中的文件,选择 Preview,然后从浏览器地址栏中复制 URL。 请勿使用共享链接。

使用 Lakeflow Connect 连接其他数据源

如果数据源在设计器中不可用,请查看 Lakeflow Connect 的托管连接器。 Lakeflow Connect 支持从 SaaS 应用程序(如 Salesforce、Workday、HubSpot 等)、数据库、云存储和流媒体源中获取数据。 使用 Lakeflow Connect 将数据引入 Unity 目录表后,可以在设计器中将其用作源。

后续步骤