Azure 数据工厂中复制活动支持的文件格式和压缩编解码器

适用于: Azure 数据工厂

本文适用于以下连接器:Amazon S3Amazon S3 兼容存储Azure BlobAzure Data Lake Storage Gen2Azure 文件存储文件系统FTPGoogle 云存储HDFSHTTPOracle 云存储SFTP

Azure 数据工厂支持以下文件格式。 请参阅每一篇介绍基于格式的设置的文章。

可以使用复制活动在两个基于文件的数据存储之间按原样复制文件,在这种情况下,无需任何序列化或反序列化即可高效复制数据。

此外,还可以分析或生成给定格式的文件。 例如,可以执行以下步骤:

  • 从 SQL Server 数据库复制数据,并将数据以 Parquet 格式写入 Azure Data Lake Storage Gen2。
  • 从本地文件系统中复制文本 (CSV) 格式文件,并将其以 Avro 格式写入 Azure Blob 存储。
  • 从本地文件系统复制压缩文件,动态解压缩,然后将提取的文件写入 Azure Data Lake Storage Gen2。
  • 从 Azure Blob 存储复制 Gzip 压缩文本 (CSV) 格式的数据,并将其写入 Azure SQL 数据库。
  • 需要序列化/反序列化或压缩/解压缩的其他许多活动。

后续步骤

请参阅其他复制活动文章: