映射数据流中的 Union 转换
适用于:Azure 数据工厂 Azure Synapse Analytics
数据流在 Azure 数据工厂和 Azure Synapse 管道中均可用。 本文适用于映射数据流。 如果不熟悉转换,请参阅介绍性文章使用映射数据流转换数据。
Union 会将多个数据流组合成一个数据流,而这些流的 SQL Union 会作为 Union 转换的新输出。 每个输入流中的所有架构都会合并到数据流中,不需要有联接键。
通过选择每个已配置的行旁边的“+”图标,你可以在设置表中对 n 个流进行组合,包括源数据以及数据流中现有转换的流。
在这种情况下,可以将来自多个源(在本例中为三个不同的源文件)的不同元数据组合在一起,将它们组合成单个流:
若要实现此目的,请在“Union 设置”中通过包括要添加的所有源来添加更多行。 无需使用常见的查找或联接键:
如果在 Union 后设置了 Select 转换,则可以重命名重叠字段或未从无标题源命名的字段。 单击“检查”以查看本例中来自三个不同源的总共包含 132 个列的组合元数据:
名称和位置
选择“按名称联合”时,每个列值都将从每个源放入相应的列中,并采用新的串联后的元数据架构。
如果选择“按位置联合”,则每个列值都将从每个相应的源放入原始位置,从而生成一个新的组合数据流,其中,来自每个源的数据将添加到同一个流中: