什么是一键式引入?
一键式引入使数据引入过程简单、快速和直观。 一键式引入可帮助你快速开始引入数据、创建数据库表、映射结构。 从不同类型的源中选择不同数据类型的数据,可以是一次性引入过程,也可以是连续引入过程。
一键式引入提供以下实用功能:
- 引入向导引导的直观体验
- 几分钟内即可引入数据
- 从不同类型的源引入数据:本地文件、blob 和容器(最多 10,000 个 blob)
- 引入各种格式的数据
- 将数据引入新表或现有表
- 建议使用表映射和架构,它们易于更改
- 使用事件网格继续轻松快速地从容器引入
首次引入数据时,或者在你不熟悉自己数据的架构时,一键式引入特别有用。
先决条件
- Azure 订阅。 创建 Azure 帐户。
- 创建群集和数据库。
- 登录到 Azure 数据资源管理器 Web UI 并添加与群集的连接。
访问一键式向导
一键式引入向导可以引导你完成一键式引入过程。
若要从 Azure 数据资源管理器 Web UI 访问向导,请使用以下方法之一:
请右键单击 Azure 数据资源管理器 Web UI 左侧菜单中的“数据库”或“表”行,然后选择“引入新数据” 。
如需从你的群集中的“欢迎使用 Azure 数据资源管理器”主屏幕访问一键式引入向导,请完成前两个步骤(群集创建和数据库创建),然后选择“引入新数据”。
若要从 Azure 门户访问该向导,请从左侧菜单中选择“查询”,右键单击“数据库”或“表”,然后选择“引入新数据” 。
一键式引入向导
注意
本部分介绍该向导的常规知识。 你选择的选项取决于要引入的数据格式、要通过其进行引入的数据源类型,以及是引入到新表还是现有表中。
有关示例场景,请参阅:
该向导会引导你配置以下选项:
架构映射
服务会自动生成架构和引入属性,你可以对其进行更改。 可以使用现有的映射结构,也可以创建一个新的映射结构,具体取决于是引入到新表还是现有表。
在“架构”选项卡中,执行以下操作:
文件格式
一键式引入支持从 Azure 数据资源管理器支持引入的所有数据格式的源数据中进行引入。
“编辑器”窗口
在“架构”选项卡的“编辑器”窗口中,可以根据需要调整数据表列 。
以下参数决定了你可在表中进行的更改:
- 表类型为“新”或“现有”
- 映射类型为“新”或“现有”
表类型 | 映射类型 | 可用调整 |
---|---|---|
新建表 | 新映射 | 更改数据类型,重命名列,新建列,删除列,更新列,升序排序,降序排序 |
现有表 | 新映射 | 新建列(你随后可在其上更改数据类型、进行重命名和更新), 更新列,升序排序,降序排序 |
现有映射 | 升序排序,降序排序 |
注意
添加新列或更新列时,可更改映射转换。 有关详细信息,请参阅映射转换
注意
可以随时打开“编辑器”窗格上方的命令编辑器。 在命令编辑器中,可以查看和复制基于输入生成的自动命令。
映射转换
某些数据格式映射(Parquet、JSON 和 Avro)支持简单的引入时间转换。 若要应用映射转换,请在编辑器窗口中创建或更新列。
可对具有 string 或 datetime 类型且“源”的数据类型为 int 或 long 的列执行映射转换 。 支持的映射转换为:
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
数据引入
完成架构映射和列操作后,引入向导将启动数据引入进程。
从非容器源引入数据时,引入会立即生效。
如果数据源是容器:
- Azure 数据资源管理器的批处理策略将聚合数据。
- 引入后,可以下载引入报告并查看每个已寻址的 blob 的性能。
- 可选择“创建持续引入”并使用事件网格设置持续引入。
初始数据探索
引入后,向导会允许你选择快速命令进行数据初始探索。