教程:使用 Azure 导入/导出服务将数据导入 Azure Blob 存储

本文提供了有关如何使用 Azure 导入/导出服务安全地将大量数据导入到 Azure Blob 存储的分步说明。 若要将数据导入到 Azure Blob,此服务要求你将包含数据的已加密磁盘驱动器寄送到某个 Azure 数据中心。

在本教程中,你将了解如何执行以下操作:

  • 将数据导入 Azure Blob 存储的先决条件
  • 步骤 1:准备驱动器
  • 步骤 2:创建导入作业
  • 步骤 3:配置客户管理的密钥(可选)
  • 步骤 4:寄送驱动器
  • 步骤 5:使用跟踪信息更新作业
  • 步骤 6:验证 Azure 中的数据上传

先决条件

在创建导入作业来将数据传输到 Azure Blob 存储之前,请仔细查看并完成此服务的以下先决条件列表。 必须具备以下条件:

  • 拥有有效的承运商帐户和订单的跟踪号:
    • 必须使用订单的“寄送”选项卡上“承运人名称”列表中的承运人 。 如果没有承运人帐户,请联系承运人创建一个。
    • 承运商帐户必须是有余额的有效帐户,且有退货功能。 我们将使用选定的承运人寄回所有存储媒体。
    • 为承运商帐户中的导入/导出作业生成跟踪号。 每个作业都应有一个单独的跟踪号。 不支持多个作业共享相同跟踪号。

步骤 1:准备驱动器

此步骤生成一个日志文件。 日志文件存储着驱动器序列号、加密密钥和存储帐户详细信息等基本信息。

请执行以下步骤来准备驱动器。

  1. 通过 SATA 连接器将磁盘驱动器连接到 Windows 系统。

  2. 在每个驱动器上创建一个 NTFS 卷。 为卷分配驱动器号。 不要使用装入点。

  3. 在 NTFS 卷上启用 BitLocker 加密。 如果使用某个 Windows Server 系统,请使用如何在 Windows Server 2012 R2 上启用 BitLocker 中的说明。

  4. 将数据复制到加密的卷。 可使用拖放或 Robocopy 或任何类似的复制工具。 在运行该工具的同一文件夹中会创建一个日志 (.jrn) 文件。

    如果驱动器已锁定并且需要解锁,不同用例的解锁步骤可能不同。

    • 如果已将数据添加到预加密驱动器(并非使用 WAImportExport 工具来加密),请使用弹出窗口中的 BitLocker 密钥(你指定的数字密码)来解锁驱动器。

    • 如果已将数据添加到由 WAImportExport 工具加密的驱动器,请使用以下命令解锁该驱动器:

      WAImportExport Unlock /bk:<BitLocker key (base 64 string) copied from journal (*.jrn*) file>

  5. 使用管理员权限打开 PowerShell 或命令行窗口。 若要将目录切换到解压缩的文件夹,请运行以下命令:

    cd C:\WaImportExportV1

  6. 若要获取驱动器的 BitLocker 密钥,请运行以下命令:

    manage-bde -protectors -get <DriveLetter>:获取 BitLocker 密钥

  7. 若要准备磁盘,请运行以下命令。 磁盘准备过程可能需要几小时到几天,具体取决于数据大小。

    ./WAImportExport.exe PrepImport /j:<journal file name> /id:session<session number> /t:<Drive letter> /bk:<BitLocker key> /srcdir:<Drive letter>:\ /dstdir:<Container name>/ /blobtype:<BlockBlob or PageBlob> /skipwrite
    

    在运行该工具的同一文件夹中会创建一个日志文件。 还会创建两个其他文件 - 一个 .xml 文件(您在其中运行工具的文件夹)和一个 drive-manifest.xml 文件(数据所在的文件夹)。

    下表介绍了所使用的参数:

    选项 说明
    /j: 带有 .jrn 扩展名的日志文件的名称。 会为每个驱动器生成一个日志文件。 建议使用磁盘序列号作为日志文件名。
    /id: 会话 ID。 请为该命令的每个实例使用唯一的会话编号。
    /t: 要寄送的磁盘的驱动器号。 例如,驱动器 D
    /bk: 驱动器的 BitLocker 密钥。 其数字密码来自 manage-bde -protectors -get D: 的输出
    /srcdir: 要寄送的磁盘的驱动器号后跟 :\。 例如,D:\
    /dstdir: Azure 存储中的目标容器的名称。
    /blobtype: 此选项指定要将数据导入到的 Blob 的类型。 对于块 Blob,Blob 类型为 BlockBlob;对于页 Blob,该项为 PageBlob
    /skipwrite: 此选项指定不需要复制任何新数据,但要准备磁盘上的现有数据。
    /enablecontentmd5: 启用此选项时,将确保计算 MD5 并将其设置为每个 blob 上的 Content-md5 属性。 仅当希望在将数据上传到 Azure 后使用 Content-md5 字段时,才使用此选项。
    此选项不影响数据完整性检查(默认情况下会进行)。 此设置确实会增加将数据上传到云所需的时间。

    注意

    • 如果导入的 blob 与目标容器中某个现有 blob 同名,则导入的 blob 将覆盖该现有 blob。 在较早的工具版本(1.5.0.300 之前)中,默认情况下会重命名导入的 blob,使用 \Disposition 参数可以指定是否重命名、覆盖或忽略导入中的 blob。
    • 如果你没有在客户端启用长路径,并且你的数据副本中的任何路径和文件名超过 256 个字符,WAImportExport 工具将报告失败。 为避免此类故障,请在 Windows 客户端上启用长路径
  8. 为需要寄送的每个磁盘重复前面的步骤。

    每次运行该命令行时,都会使用所提供的名称创建一个日志文件。

    与日志文件一起,还会在工具所在的同一文件夹中创建一个 <Journal file name>_DriveInfo_<Drive serial ID>.xml 文件。 如果日志文件过大,在创建作业时会使用该 .xml 文件来代替日志文件。

重要

  • 完成磁盘准备后,请勿修改日志文件或磁盘驱动器上的数据,也不要重新格式化任何磁盘。
  • 门户允许的日志文件的最大大小为 2 MB。 如果日志文件超出该限制,就会返回错误。

步骤 2:创建导入作业

执行以下步骤以使用 Azure 导入/导出服务在 Azure 门户中创建导入作业。

  1. 登录到 https://portal.azure.cn/

  2. 搜索“导入/导出作业”。

    Azure 门户主页顶部“搜索”框的屏幕截图。在“搜索”框中输入了“导入导出作业服务”的搜索关键字。

  3. 选择“+ 新建”。

    Azure 门户中 Azure 导入导出作业主页顶部命令菜单的屏幕截图。突出显示“+ 创建”命令。

  4. 在“基本信息”中:

    1. 选择一个订阅。

    2. 选择一个资源组,或选择“新建”,创建新资源组。

    3. 输入作业的描述性名称。 可使用此名称来跟踪作业进度。

      • 名称只能包含字母、数字和连字符。
      • 名称必须以字母开头。
    4. 选择“导入到 Azure”。

    5. 选择该订单的目标 Azure 区域。

    Azure 导入/导出作业“基本信息”选项卡的屏幕截图。其中已选中“导入到 Azure”。突出显示了新导入/导出体验的“立即试用”链接。

    选择“下一步: 作业详细信息 >”以继续。

  5. 在“作业详细信息”中:

    1. 上传你在前面的步骤 1:准备驱动器中创建的日志文件。 如果使用了 waimportexport.exe version1,请为你准备的每个驱动器上传一个文件。 如果日志文件大小超过了 2 MB,则可以使用随日志文件创建的 <Journal file name>_DriveInfo_<Drive serial ID>.xml

    2. 为该导入选择存储帐户。

      放置位置会根据选定存储帐户所属的区域自动进行填充。

    3. 如果不想保存详细日志,请清除“在 'waimportexport' Blob 容器中保存详细日志”选项。

    Azure 导入/导出作业中导入作业的“作业详细信息”选项卡的屏幕截图。其中已选中一个日志文件和一个存储帐户。突出显示了“作业详细信息”选项卡和“下一步: 发货”按钮。

    选择“下一步: 寄送 >”以继续。

  6. 在“寄送”中:

    1. 从“承运人名称”下拉列表中选择要使用的承运人。 我们将使用选定的承运人寄回所有存储媒体。

    2. 输入你创建的有效承运人帐户的“承运人帐号”。 有关承运人帐户要求,请参阅上面的“先决条件”。

    3. 提供完整、有效的联系人姓名、电话号码、电子邮件地址、街道地址、城市、邮政编码、省/自治区/直辖市和国家/地区。

      提示

      不要为单个用户指定电子邮件地址,而是提供组电子邮件,以确保即使管理员离开,你也会收到通知。

    Azure 导入导出作业中导入作业“寄送”选项卡的屏幕截图,其中显示了字段条目。突出显示“查看 + 创建”按钮。

    选择“查看 + 创建”以继续。

  7. 在订单摘要中:

    1. 请检查“条款”,然后选择“我确认提供的所有信息均正确无误,并同意上述条款和条件”,然后便会执行验证。
    2. 在摘要中复查提供的作业信息。 记下作业名称和 Azure 数据中心送货地址,以便将将磁盘寄回 Azure。 稍后将在发货标签中使用此信息。
    3. 选择“创建” 。

    显示 Azure 导入/导出作业的“查看 + 创建”选项卡的屏幕截图。突出显示了验证状态、“条款”部分和“创建”按钮。

步骤 3(可选):配置客户管理的密钥

如果要使用 Microsoft 托管密钥保护驱动器的 BitLocker 密钥,请跳过此步骤并转到下一步。 若要配置自己的密钥以保护 BitLocker 密钥,请按照在 Azure 门户中使用用于 Azure 导入/导出的 Azure 密钥保管库配置客户管理的密钥中的说明进行操作。

步骤 4:寄送驱动器

可以使用 EMS、FedEx、UPS 或 DHL 将包裹寄送到 Azure 数据中心。

  • 必须提供有效的 EMS、FedEx、UPS 或 DHL 承运商帐号,以便我们寄回驱动器。
  • 寄送包裹时,必须遵循 Azure 服务条款
  • 正确地打包磁盘以避免潜在的损坏和处理延迟。

步骤 5:使用跟踪信息更新作业

将磁盘发货后,返回 Azure 门户中的作业并填写跟踪信息。

提供跟踪详细信息后,作业状态将更改为“传送中”,并且无法取消作业。 只能在作业状态为“正在创建”时取消作业。

重要

如果在创建作业后的 2 周内未更新跟踪号,该作业会过期。

若要完成在门户中创建的作业的跟踪信息,请执行以下步骤。

  1. Azure 门户中打开作业。

  2. 在**“要让作业继续,提供跟踪信息”顶部,以打开“更新状态”窗格。 然后完成输入:

    1. 选中“标记为已寄送”旁的复选框。
    2. 提供承运商信息和跟踪号码(例如 ID:000000000000000000;SN:00000000000000)。
      • 对于跟踪号码:
      • 如果通过快递寄送,请键入有效的快递单号码 + 设备序列号。
      • 如果自己发运,请键入 ID 号 + 设备序列号。
    3. 完成后,选择“保存”。

    !显示经典门户中的 Azure 导入/导出作业的“概述”窗格上的跟踪信息的屏幕截图。突出显示了“当前作业状态”、“跟踪信息”区域以及“更新”按钮。

可以在“概述”窗格上跟踪作业进度。 有关每个作业状态的说明,请转到查看作业状态

步骤 6:验证 Azure 中的数据上传

跟踪作业直至完成。 然后,确保数据已成功上传到 Azure。 使用详细日志来验证每个已成功传输的文件,使用复制日志查找每个失败数据副本的来源 。 有关详细信息,请参阅查看导入和导出中的复制日志

验证数据传输后,可以删除本地数据。 仅在已确认上传成功后才删除本地数据。

注意

如果任何路径和文件名超过 256 个字符,并且客户端未启用长路径,则数据上传将失败。 为避免此类故障,请在 Windows 客户端上启用长路径

后续步骤