关于本地灾难恢复故障转移/故障回复(经典)

Azure Site Recovery 通过在计划内和计划外中断期间使商业应用程序保持启动和运行状态,有助于实施业务连续性和灾难恢复 (BCDR) 策略。 Site Recovery 管理并安排本地计算机和 Azure 虚拟机 (VM) 的灾难恢复。 灾难恢复包括各种工作负荷的复制、故障转移和恢复。

重要

本文概述了使用 Azure Site Recovery(经典)将本地机器灾难恢复到 Azure 期间的故障转移和故障回复。
有关 Azure Site Recovery 新版中故障转移和故障回复的信息,请参阅本文

恢复阶段

Site Recovery 中的故障转移和故障回复分为四个阶段:

  • 第 1 阶段:从本地故障转移:设置将本地计算机复制到 Azure 后,当本地站点发生故障时,这些计算机将故障转移到 Azure。 故障转移后,将会基于复制的数据创建 Azure VM。
  • 第 2 阶段:重新保护 Azure VM:在 Azure 中重新保护 Azure VM,使之开始复制回到本地站点。 重新保护期间,为帮助确保数据一致性,本地 VM(如果可用)将会关闭。
  • 第 3 阶段:从 Azure 故障转移:如果本地站点再次恢复运行正常,则运行另一次故障转移,这一次是将 Azure VM 故障回复到本地站点。 可以故障回复到从中进行故障转移的原始位置,或故障回复到备用位置。
  • 第 4 阶段:重新保护本地计算机:故障回复后,再次启用本地计算机到 Azure 的复制。

故障转移

根据业务连续性和灾难恢复 (BCDR) 策略执行故障转移。

  • BCDR 策略的第一步是持续将本地计算机复制到 Azure。 用户访问本地源计算机上运行的工作负荷和应用。
  • 如果有需要(例如,如果本地发生服务中断),可将复制计算机故障转移到 Azure。 使用复制的数据创建 Azure VM。
  • 为实现业务连续性,用户可以继续访问 Azure VM 上的应用。

故障转移是由两个阶段组成的活动:

  • 故障转移:使用所选恢复点创建并启动 Azure VM 的故障转移。
  • 提交:故障转移后,验证 Azure 中的 VM
    • 然后,可将故障转移提交到所选的恢复点,或者为提交选择另一个恢复点。
    • 提交故障转移后无法更改恢复点。

故障转移后连接到 Azure

若要使用 RDP/SSH 连接到故障转移后创建的 Azure VM,需要满足许多要求。

故障转移 位置 操作
运行 Windows 的 Azure VM 故障转移之前在本地计算机上 通过 Internet 访问:启用 RDP。 确保已针对“公共”添加了 TCP 和 UDP 规则,并确保在“Windows 防火墙”>“允许的应用”中针对所有配置文件允许 RDP 。

通过站点到站点 VPN 访问:在计算机上启用 RDP。 检查是否在“Windows 防火墙”->“允许的应用和功能”中针对“域和专用”网络允许 RDP。

确保操作系统 SAN 策略已设置为 OnlineAll了解详细信息

在触发故障转移时,请确保 VM 上没有处于挂起状态的 Windows 更新。 Windows 更新可能会在故障转移时启动,在更新完成之前,无法登录到 VM。
运行 Windows 的 Azure VM 故障转移之后在 Azure VM 上 为 VM 添加公共 IP 地址

已故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则必须允许与 RDP 端口建立传入连接。

选中“启动诊断”可查看 VM 的屏幕截图 。 如果无法连接,请检查 VM 是否正在运行,并查看故障排除提示
运行 Linux 的 Azure VM 故障转移之前在本地计算机上 确保 VM 上的安全外壳服务已设置为在系统引导时自动启动。

确保防火墙规则允许 SSH 连接。
运行 Linux 的 Azure VM 故障转移之后在 Azure VM 上 已故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则需要允许与 SSH 端口建立传入连接。

为 VM 添加公共 IP 地址

选中“启动诊断”可查看 VM 的屏幕截图 。

故障转移类型

Site Recovery 提供不同的故障转移选项。

故障转移 详细信息 恢复 Workflow
测试故障转移 用于运行演练,以在不丢失任何数据或造成停机的情况下验证 BCDR 策略。 在 Azure 中创建 VM 的副本,这不会对进行中的复制或生产环境造成任何影响。 1.针对单个 VM 或恢复计划中的多个 VM 运行测试故障转移。

2.选择用于测试故障转移的恢复点。

3.选择一个 Azure 网络,故障转移后创建的 Azure VM 将放入该网络。 该网络仅用于测试故障转移。

4.验证演练是否按预期方式进行。 Site Recovery 将自动清理演练期间在 Azure 中创建的 VM。
计划内故障转移 - Hyper-V 通常用于计划内停机。

源 VM 已关闭。 在启动故障转移之前,将同步最新的数据。
计划的工作流不会发生任何数据丢失。 1.规划停机维护时段并通知用户。

2.使面向用户的应用脱机。

3.使用最新的恢复点启动计划内故障转移。 如果计算机未关闭或遇到错误,则故障转移不会运行。

4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。

5.提交故障转移以完成操作。 提交操作将删除所有恢复点。
故障转移 - Hyper-V 通常在出现计划外服务中断或主站点不可用的情况时运行。

(可选)关闭 VM,并在启动故障转移之前同步最终更改。
应用只会出现极少量的数据丢失。 1.启动 BCDR 计划。

2.启动故障转移。 指定在触发故障转移之前 Site Recovery 应关闭 VM 并同步/复制最新的更改。

3.可以故障转移到许多恢复点选项,下表对此做了汇总。

如果未启用关闭 VM 的选项,或者 Site Recovery 无法关闭 VM,则会使用最新的恢复点。
即使无法关闭计算机,也会运行故障转移。

4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。
如果需要,可以从 24 小时保留时段中选择不同的恢复点。

5.提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。
故障转移 - VMware 通常在出现计划外服务中断或主站点不可用的情况时运行。

(可选)指定在启动故障转移之前,Site Recovery 应尝试触发 VM 关闭,并同步和复制最终的更改。
应用只会出现极少量的数据丢失。 1.启动 BCDR 计划。

2.从 Site Recovery 启动故障转移。 指定在运行故障转移之前,Site Recovery 是否应尝试触发 VM 关闭并进行同步。
即使无法关闭计算机,也会运行故障转移。

3.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。
如果需要,可以从 72 小时保留时段中选择不同的恢复点。

5.提交故障转移以完成操作。 提交操作将删除所有恢复点。
对于 Windows VM,Site Recovery 在故障转移期间会禁用 VMware 工具。

故障转移处理

在某些情况下,故障转移需要大约 8 到 10 分钟的时间完成其他进程。 对于以下情况,你可能会发现测试故障转移会持续较长时间:

  • VMware VM 运行的移动服务版本低于 9.8。
  • 物理服务器。
  • VMware Linux VM。
  • Hyper-V VM 作为物理服务器受到保护。
  • VMware VM 未启用 DHCP 服务。
  • VMware VM 不包含以下启动驱动程序:storvsc、vmbus、storflt、intelide、atapi。

恢复点选项

在故障转移期间,可以选择许多恢复点选项。

选项 详细信息
最新(最低 RPO) 此选项提供最低的恢复点目标 (RPO)。 它会首先处理已发送到 Site Recovery 服务的所有数据,为每个 VM 创建恢复点,然后将其故障转移到该恢复点。 触发故障转移后,此恢复点的所有数据将复制到 Site Recovery。
最新处理 此选项将 VM 故障转移到由 Site Recovery 处理的最新恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。 此选项提供低 RTO(恢复时间目标),因为无需费时处理未经处理的数据。
最新应用一致性 如果已启用应用一致性恢复点,此选项会将 VM 故障转移到 Site Recovery 处理的最新应用程序一致性恢复点。 在 VM 设置中检查最新的恢复点。
最新处理的多 VM 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 已启用该设置的 VM 会故障转移到最新的常用多 VM 一致恢复点。 计划中的任何其他 VM 将故障转移到最新的已处理恢复点。
最新的多 VM 应用一致性 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 属于复制组的 VM 会故障转移到最新的常用多 VM 应用程序一致恢复点。 其他 VM 故障转移到其最新的应用程序一致恢复点。
自定义 使用此选项可将特定的 VM 故障转移到特定的恢复时间点。 此选项不适用于恢复计划。

注意

恢复点无法迁移到另一个恢复服务保管库。

重新保护/故障回复

故障转移到 Azure 后,复制的 Azure VM 处于不受保护状态。

  • 故障回复到本地站点的第一步是开始将 Azure VM 复制到本地。 重新保护过程取决于故障转移的计算机的类型。
  • 将计算机从 Azure 复制到本地后,可以运行从 Azure 故障转移到本地站点的过程。
  • 计算机再次在本地运行后,可以启用复制,以便将其复制到 Azure 进行灾难恢复。

故障回复的工作原理如下:

  • VM 至少需有一个恢复点才能故障回复。 恢复计划中的所有 VM 至少需有一个恢复点。
  • 我们建议使用最新恢复点进行故障回复(崩溃一致性恢复点)。
    • 有一个应用一致性恢复点选项。 在这种情况下,单个 VM 将恢复到其最新可用的应用一致性恢复点。 对于包含复制组的恢复计划,每个复制组将恢复到其公共的可用恢复点。
    • 应用一致性恢复点在时间上可能会落后,并且可能会发生数据丢失。
  • 从 Azure 故障转移到本地站点期间,Site Recovery 将关闭 Azure VM。 提交故障转移时,Site Recovery 将删除 Azure 中已故障回复的 Azure VM。

VMware/物理机重新保护/故障回复

若要重新保护 VMware 计算机和物理服务器并将其从 Azure 故障回复到本地,需要一个故障回复基础结构,并需要满足许多要求。

  • Azure 中的临时进程服务器:若要从 Azure 进行故障回复,需要设置用作进程服务器的 Azure VM,以处理从 Azure 进行的复制。 故障回复完成后,可以删除此 VM。
  • VPN 连接:若要进行故障回复,需要设置从 Azure 网络到本地站点的 VPN 连接(或 ExpressRoute)。
  • 单独的主目标服务器:默认情况下,在本地 VMware VM 上与配置服务器一起安装的主目标服务器用于处理故障回复。 如果对大量流量进行故障回复,应创建专用于此目的的独立本地主目标服务器。
  • 故障回复策略:若要复制回到本地站点,需要创建故障回复策略。 此策略是在创建从本地到 Azure 的复制策略时自动创建的。
    • 此策略自动与配置服务器相关联。
    • 无法编辑此策略。
    • 策略值:RPO 阈值 - 15 分钟;恢复点保留期 - 24 小时;应用一致性快照频率 - 60 分钟。

详细了解 VMware/物理机重新保护和故障回复:

  • 查看重新保护和故障回复的其他要求。
  • 在 Azure 中部署进程服务器。
  • 部署单独的主目标服务器。

在本地重新保护 Azure VM 时,可以指定是要故障回复到原始位置还是备用位置。

  • 原始位置恢复:这会从 Azure 故障回复到同一台源本地计算机(如果存在)。 在这种情况下,只会将更改复制回到本地。
  • 备用位置恢复:如果本地计算机不存在,可以从 Azure 故障回复到备用位置。 在本地重新保护 Azure VM 时,将创建本地计算机。 将发生从 Azure 到本地的完整数据复制。 -- 查看位置故障回复的要求和限制。

Hyper-V 重新保护/故障回复

若要重新保护 Hyper-V VM 并将其从 Azure 故障回复到本地:

  • 只能故障回复使用存储帐户进行复制的 Hyper-V VM。 不支持故障回复使用托管磁盘复制的 Hyper-V VM。
  • 本地 Hyper-V 主机(或 System Center VMM,如果使用)应已连接到 Azure。
  • 运行从 Azure 到本地的计划内故障回复。
  • 不需要为 Hyper-V VM 故障回复设置特定的组件。
  • 在计划内故障转移期间,可以选择相应的选项,以便在故障回复之前同步数据:
    • 在故障转移之前同步数据:此选项可以最大程度地减少虚拟机的停机时间,因为它可以在不关闭虚拟机的情况下执行同步。
      • 阶段 1:生成 Azure VM 快照,并将快照复制到本地 Hyper-V 主机。 计算机将继续在 Azure 中运行。
      • 阶段 2:关闭 Azure VM,确保其不会发生任何新的更改。 将最终的增量更改集传输到本地服务器,并启动本地 VM。
    • 仅在故障转移期间同步数据:此选项速度更快,因为我们预计磁盘的大部分已经更改,因此无需执行校验和计算。 此选项会执行磁盘的下载。 如果 VM 已在 Azure 中运行了一段时间(一个月或以上)或者已删除本地 VM,则我们建议使用此选项。

详细了解 Hyper-V 重新保护和故障回复。

在本地重新保护 Azure VM 时,可以指定是要故障回复到原始位置还是备用位置。

  • 原始位置恢复:这会从 Azure 故障回复到同一台源本地计算机(如果存在)。 在这种情况下,请选择上一过程中所述的同步选项之一。
  • 备用位置恢复:如果本地计算机不存在,可以从 Azure 故障回复到备用位置。 在本地重新保护 Azure VM 时,将创建本地计算机。 如果使用此选项,我们建议选择在故障转移之前同步数据的选项
  • 查看位置故障回复的要求和限制。

故障回复到本地站点后,启用“反向复制”以开始将 VM 复制到 Azure,并完成复制周期。

后续步骤