适用于:
Azure 数据工厂
Azure Synapse Analytics
数据流在 Azure 数据工厂管道和 Azure Synapse Analytics 管道中都可用。 本文适用于映射数据流。 如果你不熟悉转换,请参阅介绍性文章: 使用映射数据流转换数据。
专用 SQL 操作 “Union” 将多个数据流合并为一个数据流,并且这些流的联合 SQL 结果构成了 Union 转换的新输出。 每个输入流中的所有架构都会合并到数据流中,不需要有联接键。
可以通过选择设置表中每个配置行旁边的“+”图标,将 n 个流合并,包括数据流中现有转换的源数据和流。
在这种情况下,可以将来自多个源(在本例中为三个不同的源文件)的不同元数据组合在一起,将它们组合成单个流:
要实现此目的,请在“Union Settings”中添加更多条目,方法是将所有希望添加的源包括在内。 无需通用查找或联接键:
如果在联合后设置 Select 转换,则可以重命名未从无标头源命名的重叠字段或字段。 选择“检查”,查看此示例中总共包含 132 列的元数据,这些列来自三个不同的源:
名称和位置
选择“按名称联合”时,每个列值都会从每个源中填入相应的列,并形成新的串联元数据架构。
如果选择“按位置联合”,则每个列值会从每个相应源中放入原始位置,从而生成新的合并数据流,其中每个源中的数据将添加到同一流中: