Site Recovery 中的故障转移

本文介绍了如何对由 Site Recovery 保护的虚拟机和物理服务器进行故障回复。

先决条件

  1. 执行故障转移之前,请先执行测试故障转移,确保一切按预期工作。
  2. 准备网络

通过下表了解 Azure Site Recovery 提供的故障转移选项。 所列选项针对不同的故障转移方案。

方案 应用程序恢复要求 Hyper V 工作流 VMware 工作流
由于即将到来的数据中心故障时间而计划的故障转移 执行计划活动时应用程序的零数据丢失 对于 Hyper-V,ASR 以用户指定的复制频率复制数据。 使用计划的故障转移在启动故障转移之前覆盖频率并复制最终更改。

1. 根据你的业务变更管理流程规划维护时段。

2.通知用户即将到来的故障时间。

3.使面向用户的应用程序脱机运行。

4.使用 ASR 门户启动计划的故障转移。 本地虚拟机将自动关闭。

有效的应用程序数据丢失 = 0

对于希望使用较早恢复点的用户,还可以提供保留期内的恢复点日志。 (对于 HYPER-V,保留期为 24 小时)。
对于 VMware,ASR 使用 CDP 持续复制数据。 故障转移可以让用户选择故障转移到最新数据(包括应用程序关闭后)

1.根据变更管理流程规划维护时段

2.通知用户即将到来的故障时间

3. 使面向用户的应用程序脱机运行。

4.在应用程序脱机后,使用 ASR 门户启动到最新点的计划故障转移。 使用门户上的“计划外的故障转移”选项,并选择最新点进行故障转移。 本地虚拟机将自动关闭。

有效的应用程序数据丢失 = 0

对于希望使用较早恢复点的用户,可以提供保留期内的恢复点日志。 (对于 VMware,保留期为 72 小时)。
由于计划外的数据中心故障时间(自然或 IT 灾难)而执行的故障转移 应用程序的最小数据丢失 1.启动组织的 BCP 计划

2.使用 ASR 门户启动到最新点或保留期(日志)内的某个点的计划外故障转移。
1.启动组织的 BCP 计划。

2.使用 ASR 门户启动到最新点或保留期(日志)内的某个点的计划外故障转移。

运行故障转移

本过程介绍了如何对恢复计划运行故障转移。 另外,还可以从“复制的项”页运行单个虚拟机或物理服务器的故障转移,如此处所述。

故障转移

  1. 选择“恢复计划” > “recoveryplan_name”。 单击“故障转移”。
  2. 在“故障转移”屏幕上,选择要故障转移到的“恢复点”。 可以使用以下选项之一:

    1. 最新:此选项通过首先处理已发送到 Site Recovery 服务的所有数据来启动作业。 处理数据可为每个虚拟机创建一个恢复点。 虚拟机在故障转移期间使用此恢复点。 此选项提供最低 RPO(恢复点目标),因为故障转移后创建的虚拟机包含触发故障转移时已复制到 Site Recovery 服务的所有数据。
    2. 最新处理的:此选项将恢复计划的所有虚拟机故障转移到已由 Site Recovery 服务处理的最新恢复点。 针对虚拟机执行测试故障转移时,也会显示最新处理的恢复点的时间戳。 如果要针对恢复计划执行故障转移,可以转到单个虚拟机,并查看“最新恢复点”磁贴来获取此信息。 由于不会花费时间来处理未经处理的数据,此选项是 RTO(恢复时间目标)较低的故障转移选项。
    3. 最新应用一致:此选项将恢复计划的所有虚拟机故障转移到已由 Site Recovery 服务处理的最新应用程序一致恢复点。 对虚拟机执行测试故障转移时,还会显示最新应用一致性恢复点的时间戳。 如果要针对恢复计划执行故障转移,可以转到单个虚拟机,并查看“最新恢复点”磁贴来获取此信息。
    4. 最新多 VM 已处理:此选项仅可用于至少有一个虚拟机已启用多 VM 一致性的恢复计划。 属于复制组的虚拟机将故障转移到最新通用多 VM 一致恢复点。 其他虚拟机将故障转移到其最近处理的恢复点。
    5. 最新多 VM 应用一致:此选项仅可用于至少有一个虚拟机已启用多 VM 一致性的恢复计划。 属于复制组的虚拟机将故障转移到最新通用多 VM 应用程序一致恢复点。 其他虚拟机将故障转移到其最新的应用程序一致恢复点。
    6. 自定义:如果要针对虚拟机执行测试故障转移,可以使用此选项故障转移到特定的恢复点。

      Note

      仅当故障转移到 Azure 时,选择恢复点的选项才可用。

  3. 如果恢复计划中的某些虚拟机已在以前的运行中进行了故障转移并且目前在源位置和目标位置都处于活动状态,则可以使用“更改方向” 选项来决定故障转移应当在哪个方向进行。

  4. 如果要故障转移到 Azure 并且为云启用了数据加密(仅当通过 VMM 服务器保护 Hyper-V 虚拟机时才适用),请在“加密密钥”中,选择在 VMM 服务器上进行设置期间启用数据加密时颁发的证书。
  5. 如果希望 Site Recovery 在触发故障转移之前尝试关闭源虚拟机,请选择“在开始故障转移之前关闭计算机”。 即使关闭失败,故障转移也仍会继续。

    Note

    如果 Hyper-V 虚拟机受到保护,则关闭选项还会在触发故障转移之前,尝试同步尚未发送到服务的本地数据。

  6. 可以在“作业”页上跟踪故障转移进度。 即使在非计划的故障转移期间发生错误,恢复计划也会运行到完成为止。

  7. 故障转移后,请登录到虚拟机来对它进行验证。 如果想要切换到虚拟机的另一个恢复点,可以使用“更改恢复点”选项。
  8. 如果故障转移后的虚拟机符合要求,可以“提交”故障转移。 提交操作会删除服务中提供的所有恢复点,并且“更改恢复点”选项将不再可用。

计划的故障转移

使用 Site Recovery 保护的虚拟机/物理服务器也支持计划的故障转移。 计划的故障转移是一个不会丢失任何数据的故障转移选项。 触发计划内故障转移时,首先会关闭源虚拟机,同步最新数据,然后再触发故障转移。

Note

在不同的本地站点之间故障转移 Hyper-V 虚拟机时,要返回到主要本地站点,必须先将虚拟机反向复制回到主站点,然后再触发故障转移。 如果主虚拟机不可用,则在开始反向复制之前,必须从备份还原虚拟机。

故障转移作业

故障转移

触发故障转移时,将执行以下步骤:

  1. 先决条件检查:此步骤确保满足故障转移需要的所有条件
  2. 故障转移:此步骤处理数据并使其准备就绪,以便可以根据该数据创建 Azure 虚拟机。 如果你选择了 最新 恢复点,则此步骤基于已发送到服务的数据创建一个恢复点。
  3. 启动:此步骤使用在上一步骤中处理的数据创建 Azure 虚拟机。

Warning

不要取消正在进行的故障转移:开始故障转移之前,将停止虚拟机的复制。 如果 取消 正在进行的作业,则故障转移会停止,但虚拟机不会开始复制。 无法再次启动复制。

故障转移至 Azure 的耗时

在某些情况下,虚拟机的故障转移需要额外的中间步骤,中间步骤通常耗费约 8 到 10 分钟才能完成。 在以下情况下,故障转移所需的时间比通常更多:

  • VMware 虚拟机所使用的移动服务版本早于 9.8
  • 物理服务器
  • VMware Linux 虚拟机
  • 作为物理服务器受到保护的 Hyper-V 虚拟机
  • VMware 虚拟机,其中下列驱动程序不作为启动驱动程序
    • storvsc
    • vmbus
    • storflt
    • intelide
    • atapi
  • 未启用 DHCP 服务的 VMware 虚拟机(无论它们使用 DHCP 还是使用静态 IP 地址)

在其他所有情况下,此中间步骤都非必需,因而故障转移的耗时会减少。

在故障转移中使用脚本

执行故障转移时,你可能希望自动执行某些操作。 在恢复计划中使用脚本可以实现此目的。

故障转移后注意事项

故障转移后,可能需要考虑以下建议:

在故障转移后保留驱动器号

若要在故障转移后保留虚拟机上的驱动器号,可将虚拟机的“SAN 策略”设置为 OnlineAll了解详细信息

准备在故障转移后连接到 Azure VM

如果想要在故障转移后使用 RDP/SSH 连接到 Azure VM,请遵照此处表格中汇总的要求。

请按照此处所述的步骤对故障转移后的任何连接问题进行故障排除。

后续步骤

Warning

故障转移虚拟机并且本地数据中心可用后,应该在本地数据中心重新保护 VMware 虚拟机。

使用“计划的故障转移”选项可将 Hyper-V 虚拟机从 Azure“故障回复”到本地。

如果已将 Hyper-V 虚拟机故障转移到 VMM 服务器管理的另一个本地数据中心并且主数据中心可用,请使用“反向复制”选项开始复制回到主数据中心。