使用 Azure 数据工厂或 Synapse Analytics 中的复制活动保留元数据和 ACL
适用于:Azure 数据工厂 Azure Synapse Analytics
使用 Azure 数据工厂或 Synapse Analytics 管道的复制活动将数据从源复制到接收器时,在以下情况下,还可以保留元数据和 ACL。
保留数据湖迁移的元数据
将数据从一个数据湖迁移到另一个数据湖(包括 Amazon S3、Azure Blob、Azure Data Lake Storage Gen2 和 Azure文件存储)时,可选择保留文件元数据和数据。
复制活动支持在数据复制期间保留以下属性:
- 所有客户指定的元数据
- 以及以下五个数据存储内置系统属性: 、 (Amazon S3 除外)、
contentType
、contentLanguage
、contentEncoding
contentDisposition
cacheControl
。
处理元数据的差异: Amazon S3 和 Azure 存储允许在客户指定的元数据键中使用不同的字符集。 选择使用复制活动保留元数据时,服务会自动将无效字符替换为“_”。
按原样将文件从 Amazon S3/Azure Data Lake Storage Gen2/Azure Blob 存储/Azure 文件存储复制到二进制格式的 Azure Data Lake Storage Gen2/Azure Blob 存储/Azure 文件存储时,可以在用于活动创作的“复制活动”>“设置”选项卡或复制数据工具中的“设置”页上找到“保留”选项 。
下面是复制活动 JSON 配置的示例(请参阅 preserve
):
"activities":[
{
"name": "CopyAndPreserveMetadata",
"type": "Copy",
"typeProperties": {
"source": {
"type": "BinarySource",
"storeSettings": {
"type": "AmazonS3ReadSettings",
"recursive": true
}
},
"sink": {
"type": "BinarySink",
"storeSettings": {
"type": "AzureBlobFSWriteSettings"
}
},
"preserve": [
"Attributes"
]
},
"inputs": [
{
"referenceName": "<Binary dataset Amazon S3/Azure Blob/ADLS Gen2 source>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<Binary dataset for Azure Blob/ADLS Gen2 sink>",
"type": "DatasetReference"
}
]
}
]
相关内容
请参阅其他复制活动文章: