使用 Azure 数据工厂或 Synapse Analytics 中的复制活动保留元数据和 ACL

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用

使用 Azure 数据工厂或 Synapse Analytics 管道的复制活动将数据从源复制到接收器时,在以下情况下,还可以保留元数据和 ACL。

保留数据湖迁移的元数据

将数据从一个数据湖迁移到另一个数据湖(包括 Amazon S3Azure BlobAzure Data Lake Storage Gen2Azure文件存储)时,可选择保留文件元数据和数据。

复制活动支持在数据复制期间保留以下属性:

  • 所有客户指定的元数据
  • 以及以下五个数据存储内置系统属性: (Amazon S3 除外)、contentTypecontentLanguagecontentEncodingcontentDispositioncacheControl

处理元数据的差异: Amazon S3 和 Azure 存储允许在客户指定的元数据键中使用不同的字符集。 选择使用复制活动保留元数据时,服务会自动将无效字符替换为“_”。

按原样将文件从 Amazon S3/Azure Data Lake Storage Gen2/Azure Blob 存储/Azure 文件存储复制到二进制格式的 Azure Data Lake Storage Gen2/Azure Blob 存储/Azure 文件存储时,可以在用于活动创作的“复制活动”>“设置”选项卡或复制数据工具中的“设置”页上找到“保留”选项 。

复制活动保留元数据

下面是复制活动 JSON 配置的示例(请参阅 preserve):

"activities":[
    {
        "name": "CopyAndPreserveMetadata",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "BinarySource",
                "storeSettings": {
                    "type": "AmazonS3ReadSettings",
                    "recursive": true
                }
            },
            "sink": {
                "type": "BinarySink",
                "storeSettings": {
                    "type": "AzureBlobFSWriteSettings"
                }
            },
            "preserve": [
                "Attributes"
            ]
        },
        "inputs": [
            {
                "referenceName": "<Binary dataset Amazon S3/Azure Blob/ADLS Gen2 source>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Binary dataset for Azure Blob/ADLS Gen2 sink>",
                "type": "DatasetReference"
            }
        ]
    }
]

请参阅其他复制活动文章: