什么是一键式引入?

一键式引入使数据引入过程简单、快速和直观。 一键式引入可帮助你快速开始引入数据、创建数据库表、映射结构。 从不同类型的源中选择不同数据类型的数据,可以是一次性引入过程,也可以是连续引入过程。

一键式引入提供以下实用功能:

  • 引入向导引导的直观体验
  • 几分钟内即可引入数据
  • 从不同类型的源引入数据:本地文件、blob 和容器(最多 10,000 个 blob)
  • 引入各种格式的数据
  • 将数据引入新表或现有表
  • 建议使用表映射和架构,它们易于更改
  • 使用事件网格继续轻松快速地从容器引入

首次引入数据时,或者在你不熟悉自己数据的架构时,一键式引入特别有用。

先决条件

访问一键式向导

一键式引入向导可以引导你完成一键式引入过程。

  • 若要从 Azure 数据资源管理器 Web UI 访问向导,请使用以下方法之一:

    • 请右键单击 Azure 数据资源管理器 Web UI 左侧菜单中的“数据库”或“表”行,然后选择“引入新数据” 。

      Screenshot of selection of one-click ingestion in the Azure Data Explorer web UI.

  • 如需从你的群集中的“欢迎使用 Azure 数据资源管理器”主屏幕访问一键式引入向导,请完成前两个步骤(群集创建和数据库创建),然后选择“引入新数据”。

    Ingest new data from welcome to Azure Data Explorer.

  • 若要从 Azure 门户访问该向导,请从左侧菜单中选择“查询”,右键单击“数据库”或“表”,然后选择“引入新数据” 。

    Access the one click ingestion wizard from Azure portal.

一键式引入向导

注意

本部分介绍该向导的常规知识。 你选择的选项取决于要引入的数据格式、要通过其进行引入的数据源类型,以及是引入到新表还是现有表中。

有关示例场景,请参阅:

该向导会引导你配置以下选项:

  • 引入到现有表
  • 引入到新表
  • 从以下数据源引入数据:
    • Blob 存储:最多 10 个 blob
    • 本地文件:最多 10 个文件
    • 容器(Blob 容器、ADLS Gen1 容器、ADLS Gen2 容器)

架构映射

服务会自动生成架构和引入属性,你可以对其进行更改。 可以使用现有的映射结构,也可以创建一个新的映射结构,具体取决于是引入到新表还是现有表。

在“架构”选项卡中,执行以下操作:

  • 确认自动生成的压缩类型。
  • 选择数据的格式。 不同的格式会允许你进行进一步的更改。
  • 更改编辑器窗口中的映射。

文件格式

一键式引入支持从 Azure 数据资源管理器支持引入的所有数据格式的源数据中进行引入。

“编辑器”窗口

在“架构”选项卡的“编辑器”窗口中,可以根据需要调整数据表列 。

以下参数决定了你可在表中进行的更改:

  • 表类型为“新”或“现有”
  • 映射类型为“新”或“现有”
表类型 映射类型 可用调整
新建表 新映射 更改数据类型,重命名列,新建列,删除列,更新列,升序排序,降序排序
现有表 新映射 新建列(你随后可在其上更改数据类型、进行重命名和更新),
更新列,升序排序,降序排序
现有映射 升序排序,降序排序

注意

添加新列或更新列时,可更改映射转换。 有关详细信息,请参阅映射转换

注意

可以随时打开“编辑器”窗格上方的命令编辑器。 在命令编辑器中,可以查看和复制基于输入生成的自动命令。

映射转换

某些数据格式映射(Parquet、JSON 和 Avro)支持简单的引入时间转换。 若要应用映射转换,请在编辑器窗口中创建或更新列。

可对具有 string 或 datetime 类型且“源”的数据类型为 int 或 long 的列执行映射转换 。 支持的映射转换为:

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

数据引入

完成架构映射和列操作后,引入向导将启动数据引入进程。

  • 从非容器源引入数据时,引入会立即生效。

  • 如果数据源是容器:

初始数据探索

引入后,向导会允许你选择快速命令进行数据初始探索。

后续步骤