映射数据工具是一个引导过程,可帮助用户创建 ETL 映射并将数据流从源数据映射到 Synapse lake 数据库表,而无需编写代码。 此过程从用户选择 Synapse Lake 数据库中的目标表开始,然后将源数据映射到这些表。
地图数据提供了引导式体验,用户可以在其中生成映射数据流,而无需从空白画布开始。 然后,你可以快速生成可在 Synapse 管道中运行的可扩展映射数据流。
“映射数据”工具从 Synapse 湖数据库体验中启动。 在此处,可以选择地图数据工具开始该过程。
“映射数据”需要可用的计算来帮助用户预览数据和读取其源文件的模式。 首次在会话中使用地图数据时,需要预热群集。
要开始,请选择要映射到湖数据库表的数据源。 目前支持的数据源是 Azure Data Lake Storage Gen 2 和 Synapse Lake 数据库。
选择文件存储(例如 Azure Data Lake Storage Gen 2)时,支持以下文件类型:
- 通用数据模型
- 带分隔符的文本
- Parquet
使用你选择的源类型配置数据映射。
备注
可以选择文件夹或单个文件。 如果选择一个文件夹,则可以将多个文件映射到 Lake 数据库表。 如果选择文件夹,选择“继续”后,系统也会提示仅包括特定文件(如果需要)。
命名数据映射并选择 Synapse 湖数据库目标。
选择要映射到 Synapse 湖数据库目标表的主源表。
使用“新建映射”按钮添加映射方法以创建映射或转换。
使用“其他源”按钮加入并添加另一个源到你的映射中。
“ 数据预览 ”选项卡提供每个转换数据的交互式快照。 有关详细信息,请参阅调试模式下的数据预览。
支持以下映射方法:
完成映射数据转换后,选择“创建管道”按钮以生成映射数据流和管道以调试和运行转换。