什么是引入向导?

引入向导是用于在 Azure 数据资源管理器 Web UI 中引入数据的用户界面。 引入向导可用于以各种形式(一次性引入或连续引入)引入数据,并创建数据库表和映射结构。

引入向导提供以下功能:

  • 引入向导引导的直观体验
  • 几分钟内即可引入数据
  • 从不同类型的源引入数据:本地文件、blob 和容器(最多 10,000 个 blob)
  • 引入各种格式的数据
  • 将数据引入新表或现有表
  • 建议使用表映射和架构,它们易于更改
  • 使用事件网格继续轻松快速地从容器引入

先决条件

注意

若要在没有公共访问权限的情况下启用群集和存储帐户之间的访问(仅限于专用终结点/服务终结点),请参阅创建托管专用终结点

访问引入向导

引入向导有许多入口点。

  • 在 Web UI 的左侧窗格中,选择“数据”。 在“数据管理”页中,选择一种引入类型,然后选择“引入”。

    从 Azure 数据资源管理器 Web UI 界面 - Azure 数据资源管理器的“数据管理”窗口引入数据的选项的屏幕截图。

  • 在 Web UI 的左侧窗格中,选择“查询”。 右键单击“数据库”或“表”,然后选择“引入数据”。

    在 Azure 数据资源管理器 Web UI 中选择引入向导的屏幕截图。

  • 在 Web UI 中,选择左窗格中的“我的群集”,然后选择“引入”。

    从“欢迎使用 Azure 数据资源管理器”中引入新数据。

  • 若要从 Azure 门户访问引入向导,请从左侧菜单中选择“查询”,右键单击数据库或表,然后选择“引入新数据”。

    从 Azure 门户访问引入向导。

引入向导

注意

本部分介绍引入向导的常规知识。 你选择的选项取决于要引入的数据格式、要通过其进行引入的数据源类型,以及是引入到新表还是现有表中。

有关示例场景,请参阅:

该向导会引导你配置以下选项:

  • 引入到现有表
  • 引入到新表
  • 从以下数据源引入数据:
    • Blob 存储:最多 10 个 blob
    • 本地文件:最多 10 个文件
    • 容器(Blob 容器、ADLS Gen1 容器、ADLS Gen2 容器)

架构映射

服务会自动生成架构和引入属性,你可以对其进行更改。 可以使用现有的映射结构,也可以创建一个新的映射结构,具体取决于是引入到新表还是现有表。

在“架构”选项卡中,执行以下操作:

  • 确认自动生成的压缩类型。
  • 选择数据的格式。 使用不同的格式,你可以进行进一步的更改。
  • 更改编辑器窗口中的映射。

文件格式

引入向导支持从 Azure 数据资源管理器支持引入的所有数据格式的源数据中进行引入。

“编辑器”窗口

在“架构”选项卡的“编辑器”窗口中,可以根据需要调整数据表列 。

以下参数决定了你可在表中进行的更改:

  • 表类型为“新”或“现有”
  • 映射类型为“新”或“现有”
表类型 映射类型 可用调整
新建表 新映射 更改数据类型,重命名列,新建列,删除列,更新列,升序排序,降序排序
现有表 新映射 新建列(你随后可在其上更改数据类型、进行重命名和更新),
更新列,升序排序,降序排序
现有映射 升序排序,降序排序

注意

添加新列或更新列时,可更改映射转换。

注意

可以随时打开“编辑器”窗格上方的命令编辑器。 在命令编辑器中,可以查看和复制基于输入生成的自动命令。

映射转换

某些数据格式映射(Parquet、JSON 和 Avro)支持简单的引入时间转换。 若要应用映射转换,请在编辑器窗口中创建或更新列。

可对具有 string 或 datetime 类型且“源”的数据类型为 int 或 long 的列执行映射转换 。 支持的映射转换为:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

数据引入

当你完成架构映射和列操作后,引入向导就会启动数据引入进程。

  • 从非容器源引入数据时,引入会立即生效。

  • 如果数据源是容器:

初始数据探索

引入后,向导会允许你选择快速命令进行数据初始探索。

更多数据管理操作

通过选择下表中的链接,发现每个“数据管理”选项卡中的可用选项。

选项卡 引入选项
管理 创建外部表和更新批处理以及保留策略。
一次性引入 本地文件、Blob 存储容器引入。
连续引入 从事件中心或 Blob 容器配置连续引入。
回填 以一次性或连续引入的方式从源中引入数据。
SDK 示例应用生成器向导是一个工具,使你能够以首选编程语言创建工作应用来引入和查询数据。 详细了解连接器,以扩展和探索 Azure 数据资源管理器的功能。

后续步骤