映射数据流中的 Union 转换

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用

数据流在 Azure 数据工厂和 Azure Synapse 管道中均可用。 本文适用于映射数据流。 如果不熟悉转换,请参阅介绍性文章使用映射数据流转换数据

Union 会将多个数据流组合成一个数据流,而这些流的 SQL Union 会作为 Union 转换的新输出。 每个输入流中的所有架构都会合并到数据流中,不需要有联接键。

通过选择每个已配置的行旁边的“+”图标,你可以在设置表中对 n 个流进行组合,包括源数据以及数据流中现有转换的流。

Union transformation

在这种情况下,可以将来自多个源(在本例中为三个不同的源文件)的不同元数据组合在一起,将它们组合成单个流:

Union transformation overview

若要实现此目的,请在“Union 设置”中通过包括要添加的所有源来添加更多行。 无需使用常见的查找或联接键:

Union transformation settings

如果在 Union 后设置了 Select 转换,则可以重命名重叠字段或未从无标题源命名的字段。 单击“检查”以查看本例中来自三个不同源的总共包含 132 个列的组合元数据:

Union transformation final

名称和位置

选择“按名称联合”时,每个列值都将从每个源放入相应的列中,并采用新的串联后的元数据架构。

如果选择“按位置联合”,则每个列值都将从每个相应的源放入原始位置,从而生成一个新的组合数据流,其中,来自每个源的数据将添加到同一个流中:

Union output

探究类似的转换,包括 JoinExists