使用 Azure 数据工厂中的复制活动保留元数据和 ACL

适用于: Azure 数据工厂

当使用 Azure 数据工厂复制活动将数据从源复制到接收器时,在以下情况下,还可以保留元数据和 ACL。

保留数据湖迁移的元数据

将数据从一个数据湖迁移到另一个数据湖(包括 Amazon S3Azure BlobAzure Data Lake Storage Gen2Azure文件存储)时,可选择保留文件元数据和数据。

复制活动支持在数据复制期间保留以下属性:

  • 所有客户指定的元数据
  • 以及以下五个数据存储内置系统属性: (Amazon S3 除外)、contentTypecontentLanguagecontentEncodingcontentDispositioncacheControl

处理元数据的差异: Amazon S3 和 Azure 存储允许在客户指定的元数据键中使用不同的字符集。 选择使用复制活动保留元数据时,服务会自动将无效字符替换为“_”。

按原样将文件从 Amazon S3/Azure Data Lake Storage Gen2/Azure Blob 存储/Azure 文件存储复制到二进制格式的 Azure Data Lake Storage Gen2/Azure Blob 存储/Azure 文件存储时,可以在用于活动创作的“复制活动”>“设置”选项卡或复制数据工具中的“设置”页上找到“保留”选项 。

Copy activity preserve metadata

下面是复制活动 JSON 配置的示例(请参阅 preserve):

"activities":[
    {
        "name": "CopyAndPreserveMetadata",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "BinarySource",
                "storeSettings": {
                    "type": "AmazonS3ReadSettings",
                    "recursive": true
                }
            },
            "sink": {
                "type": "BinarySink",
                "storeSettings": {
                    "type": "AzureBlobFSWriteSettings"
                }
            },
            "preserve": [
                "Attributes"
            ]
        },
        "inputs": [
            {
                "referenceName": "<Binary dataset Amazon S3/Azure Blob/ADLS Gen2 source>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Binary dataset for Azure Blob/ADLS Gen2 sink>",
                "type": "DatasetReference"
            }
        ]
    }
]

后续步骤

请参阅其他复制活动文章: