Azure Data Box 限制
部署和操作 Azure Data Box 时请考虑这些限制。 下表介绍了 Data Box 的这些限制。
Data Box 服务限制
- 如果通过 Data Box 服务使用多个存储帐户,则所有存储帐户应属于同一 Azure 区域。
- 我们建议使用不超过三个存储帐户。 使用更多存储帐户可能影响性能。
Data Box 限制
- Data Box 最多可存储导入和导出的 5 亿个文件。
- Data Box 在云中最多支持 512 个容器或共享。 用户共享中的顶层目录将成为云中的容器或 Azure 文件共享。
- 由于 ReFS 元数据空间消耗,Data Box 用量容量可能小于 80 TiB。
- Data Box 在网络文件系统 (NFS) 共享上一次最多支持 10 个客户端连接。
Azure 存储限制
本部分介绍了应用于 Data Box 服务的 Azure 存储服务限制,以及 Azure 文件、Azure 块 blob 和 Azure 页 blob 的必需命名约定。 请仔细查看存储限制并遵循所有建议。
有关 Azure 存储服务限制的最新信息以及对共享、容器和文件进行命名的最佳做法,请转到:
重要
如果有任何文件或目录超出了 Azure 存储服务限制,或者不符合 Azure 文件/Blob 命名约定,则这些文件或目录不会通过 Data Box 服务引入到 Azure 存储中。
数据复制和上传注意事项
导入命令
Data Box 导入命令的注意事项包括:
- 容器、共享和文件夹:
- 不要直接将文件复制到任何预创建的共享。 需要在共享下创建文件夹,然后将文件复制到该文件夹。
- StorageAccount_BlockBlob 和 StorageAccount_PageBlob 下的文件夹为容器。 例如,容器创建为 StorageAccount_BlockBlob/container 和 StorageAccount_PageBlob/container。
- 直接在 StorageAccount_AzFile 下创建的每个文件夹都将转换为 Azure 文件共享。
- Azure Blob 存储不支持目录。 如果在 StorageAccount_BlockBlob 文件夹下创建文件夹,将以 blob 的名义创建虚拟文件夹。 对于 Azure 文件,将维护实际的目录结构。
- 合并文件夹内容:
- 写入到 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 共享中的每个文件将分别上传为块 blob 和页 blob。
- 如果文件夹与现有容器同名,则文件夹的内容将与容器的内容合并。 云中尚未有的文件或 Blob 将添加到容器中。 如果某个文件或 Blob 与容器中已有的文件或 Blob 同名,则会覆盖现有文件或 Blob。
- 如果容器具有同名的现有存档 blob,上传到存档层中的 blob 将失败。 当 blob 位于存档层时,无法对其进行读取或修改。 如果需要覆盖 blob,请确保 blob 未设置为存档。 有关详细信息,请参阅存档访问层。
- 在 StorageAccount_BlockBlob 和 StorageAccount_PageBlob 文件夹下创建的任何空目录层次结构(没有任何文件)都不会上传。
- Azure Data Box 不支持将数据导入 NFS Azure 文件共享。 如果将数据从 Data Box 复制到现有的 NFS Azure 文件共享中,名称与源文件夹相同,会产生冲突。 为了解决此冲突,Data Box 会将源共享重命名为
databox-<GUID>
,并将其作为 SMB Azure 文件共享上传到目标存储帐户。 - 如果将 SMB 和 NFS 协议用于数据副本,建议:
- 对 SMB 和 NFS 使用不同的存储帐户。
- 不要使用 SMB 和 NFS 将相同的数据复制到 Azure 中的同一端目标。 在这些情况下,最终的结果不可确定。
- 尽管可以同时通过 SMB 和 NFS 进行复制,但我们不建议这样做,因为这很容易出现人为错误。 等待 SMB 数据复制完成,然后启动 NFS 数据复制。
- 上传管理:
- 如果将数据上传到 Azure 时发生任何错误,则会在目标存储帐户中创建一个错误日志。 当上传完成时,可以找到此错误日志的路径,并且可以查看此日志来采取纠正措施。 在验证上传的数据之前,不要删除源中的数据。
- 根据保留 Azure Data Box 的文件 ACL、属性和时间戳中的指南将数据上传到 Azure 文件存储时,可以保留文件元数据和 NTFS 权限。
- 在将 Blob 和 Azure 文件存储上传到云时,将保留文件的层次结构。 例如,你在以下路径复制了一个文件:
<container folder>\A\B\C.txt
。 此文件将上传到云中的相同路径。 - 如果在上传期间文件的 CreateTime 或 LastWriteTime 字段超出允许的大小,则 Azure 文件属性中的原始日期将替换为“Fri, 31 Dec 9999 23:59:59”。 文件上传成功,未引发任何错误。
导出命令
Data Box 导出命令的注意事项包括:
- Data Box 是一种基于 Windows 的设备,不支持区分大小写的文件名。 例如,Azure 中可能有两个不同的文件,其名称只是大小写不同。 请勿使用 Data Box 来导出这些文件,因为文件将在设备上被覆盖。
- 如果输入文件或标记中存在引用相同数据的重复标记,则 Data Box 导出可能会跳过或覆盖文件。 Azure 门户显示的文件数和数据大小可能不同于设备上数据的实际大小。
- Data Box 通过服务器消息块 (SMB) 协议将数据导出到基于 Windows 的系统,并受文件和文件夹的 SMB 限制的约束。 名称不受支持的文件和文件夹不会导出。
- 从前缀到容器的映射为 1:1。
- 文件名的大小最大为 1024 个字符。 超过此长度的文件名不会被导出。
- (在命令创建过程中上传的)Xml文件中的重复前缀会导出 。 不会省略重复的前缀。
- 页 blob 和容器名称区分大小写。 如果大小写不匹配,就无法找到 blob 和/或容器。
Azure 存储帐户大小限制
下面是对复制到存储帐户的数据的大小限制。 请确保上传的数据符合这些限制。 有关这些限制的最新信息,请参阅 Blob 存储的可伸缩性和性能目标和 Azure 文件存储的可伸缩性和性能目标。
复制到 Azure 存储帐户的数据的大小 | 默认限制 |
---|---|
块 Blob 和页 blob | 最大限制与为 Azure 订阅规定的存储限制相同,并且包含来自所有源(包括 Data Box)的数据。 |
Azure 文件 | Data Box 支持 Azure 高级文件共享,允许存储帐户中的所有共享总共有 100 TiB。 由于复制日志和审核日志占用了一定的空间,因此最大可用容量略低。 为复制日志和审核日志至少各保留 100 GiB。 有关详细信息,请参阅 Azure Data Box 的审核日志。 “StorageAccount_AzFile”下的所有文件夹都须遵循此限制。 有关详细信息,请参阅创建 Azure 文件共享。 |
Azure 对象大小限制
下面是可以写入的 Azure 对象的大小。 请确保上传的所有文件都符合这些限制。
Azure 对象类型 | 默认限制 |
---|---|
块 blob | 14 TiB |
页 blob | 4 TiB 以页 Blob 格式上传的文件都必须是 512 字节对齐(整数倍),否则上传失败。 VHD 和 VHDX 为 512 字节对齐。 |
Azure 文件 | 4 TiB |
托管磁盘 | 4 TiB 有关大小和限制的详细信息,请参阅: |
Azure 块 blob、页 blob 和文件命名约定
实体 | 约定 |
---|---|
块 Blob 和页 Blob 的容器名称 | 必须是有效的 DNS 名称,长度为 3 到 63 个字符。 必须以字母或数字开头。 只能包含小写字母、数字和连字符 (-)。 每个连字符 (-) 字符的前后必须紧接字母或数字。 名称中不允许连续的连字符。 |
Azure 文件的共享名 | 同上 |
Azure 文件的目录和文件名 | " \ / : | < > * ? |
块 Blob 和页 Blob 的 Blob 名称 |