Azure 数据工厂和 Azure Synapse Analytics 中的复制活动支持的文件格式和压缩编解码器

2025/04/22

适用于： Azure 数据工厂 Azure Synapse Analytics

本文适用于以下连接器：Amazon S3、Amazon S3 兼容存储、Azure Blob、Azure Data Lake Storage Gen2、Azure 文件存储、文件系统、FTP、Google 云存储、HDFS、HTTP、Oracle 云存储和 SFTP。

Azure 数据工厂支持以下文件格式。请参阅每一篇介绍基于格式的设置的文章。

可以使用复制活动在两个基于文件的数据存储之间按原样复制文件，在这种情况下，无需任何序列化或反序列化即可高效复制数据。

此外，还可以分析或生成给定格式的文件。例如，可以执行以下步骤：

从 SQL Server 数据库复制数据，并将数据以 Parquet 格式写入 Azure Data Lake Storage Gen2。
从本地文件系统中复制文本 (CSV) 格式文件，并将其以 Avro 格式写入 Azure Blob 存储。
从本地文件系统复制压缩文件，动态解压缩，然后将提取的文件写入 Azure Data Lake Storage Gen2。
从 Azure Blob 存储复制 Gzip 压缩文本 (CSV) 格式的数据，并将其写入 Azure SQL 数据库。
需要序列化/反序列化或压缩/解压缩的其他许多活动。

请参阅其他复制活动文章：