在 Azure Synapse Analytics 中映射数据

什么是地图数据工具?

映射数据工具是一个引导过程,可帮助用户创建 ETL 映射并将数据流从源数据映射到 Synapse lake 数据库表,而无需编写代码。 此过程从用户选择 Synapse Lake 数据库中的目标表开始,然后将源数据映射到这些表。

地图数据提供了引导式体验,用户可以在其中生成映射数据流,而无需从空白画布开始。 然后,你可以快速生成可在 Synapse 管道中运行的可扩展映射数据流。

入门指南

“映射数据”工具从 Synapse 湖数据库体验中启动。 在此处,可以选择地图数据工具开始该过程。

显示如何打开地图数据的屏幕截图。

“映射数据”需要可用的计算来帮助用户预览数据和读取其源文件的模式。 首次在会话中使用地图数据时,需要预热群集。 显示调试群集的屏幕截图。

要开始,请选择要映射到湖数据库表的数据源。 目前支持的数据源是 Azure Data Lake Storage Gen 2 和 Synapse Lake 数据库。 显示来源的屏幕截图。

文件类型选项

选择文件存储(例如 Azure Data Lake Storage Gen 2)时,支持以下文件类型:

  • 通用数据模型
  • 带分隔符的文本
  • Parquet

创建数据映射

使用你选择的源类型配置数据映射。 显示地图数据文件配置的屏幕截图。

备注

可以选择文件夹或单个文件。 如果选择一个文件夹,则可以将多个文件映射到 Lake 数据库表。 如果选择文件夹,选择“继续”后,系统也会提示仅包括特定文件(如果需要)。

命名数据映射并选择 Synapse 湖数据库目标。 显示命名和目标的屏幕截图。

源到目标映射

选择要映射到 Synapse 湖数据库目标表的主源表。 显示地图数据规则的屏幕截图。

新映射

使用“新建映射”按钮添加映射方法以创建映射或转换。

其他源

使用“其他源”按钮加入并添加另一个源到你的映射中。

预览数据

数据预览 ”选项卡提供每个转换数据的交互式快照。 有关详细信息,请参阅调试模式下的数据预览

映射方法

支持以下映射方法:

创建管道

完成映射数据转换后,选择“创建管道”按钮以生成映射数据流和管道以调试和运行转换。