将测试故障转移(灾难恢复演练)运行到 Azure

本文介绍如何使用 Site Recovery 测试故障转移运行到 Azure 的灾难恢复演练。

运行测试故障转移可以验证复制和灾难恢复策略,且不会丢失任何数据或造成停机。 测试故障转移不会对正在进行的复制或生产环境造成任何影响。 可在特定的虚拟机 (VM) 或者包含多个 VM 的恢复计划中运行测试故障转移。

运行测试故障转移

本过程描述如何对恢复计划运行测试故障转移。 如果要为单个 VM 运行测试故障转移,请按照此处所述的步骤进行操作

Screenshot of the Test failover page in the Azure portal.

  1. 在 Azure 门户上的“Site Recovery”中,单击“恢复计划”>“recoveryplan_name”>“测试故障转移”。

  2. 选择要故障转移到的“恢复点”。 可以使用以下选项之一:

    • 最新处理:此选项将计划中的所有 VM 故障转移到由 Site Recovery 处理的最新恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。 此选项提供低 RTO(恢复时间目标),因为无需费时处理未经处理的数据。
    • 最新的应用一致:此选项将计划中的所有 VM 故障转移到由 Site Recovery 处理的最新应用程序一致恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。
    • 最新:此选项首先处理已发送到 Site Recovery 服务的所有数据,为每个 VM 创建恢复点,然后将其故障转移到该恢复点。 此选项提供最低的 RPO(恢复点目标),因为故障转移后创建的 VM 具有触发故障转移时复制到 Site Recovery 的所有数据。
    • 最新多 VM 已处理:此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 已启用该设置的 VM 会故障转移到最新的常用多 VM 一致恢复点。 其他 VM 故障转移到最新的已处理恢复点。
    • 最新多 VM 应用一致性:此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 属于复制组的 VM 会故障转移到最新的常用多 VM 应用程序一致恢复点。 其他 VM 故障转移到其最新的应用程序一致恢复点。
    • 自定义:使用此选项可将特定的 VM 故障转移到特定的恢复点。
  3. 选择要在其中创建测试 VM 的 Azure 虚拟网络。

    • Site Recovery 尝试在子网中创建测试 VM,该子网的名称与 IP 地址与 VM 的“计算和网络”设置中提供的值相同。
    • 如果用于测试故障转移的 Azure 虚拟网络中没有同名的子网,则会按字母顺序在第一个子网中创建测试 VM。
    • 如果该子网中没有相同的 IP 地址,则 VM 会接收该子网中的另一个可用 IP 地址。 了解详细信息
  4. 在“作业”选项卡上跟踪故障转移进度。你应该能够在 Azure 门户中看到测试副本计算机。

  5. 若要通过 RDP 与 Azure VM 发起连接,需在故障转移的 VM 的网络接口上添加公共 IP 地址

  6. 如果一切符合预期,请单击“清理测试故障转移”。 这会删除在执行测试故障转移期间创建的 VM。

  7. 在“说明”中,记录并保存与测试性故障转移相关联的任何观测结果。

Screenshot of the Test failover Jobs tab.

触发测试故障转移时,会发生以下情况:

  1. 先决条件:运行先决条件检查,确保符合故障转移所需的所有条件。
  2. 故障转移:故障转移会处理并准备好数据,以便能够基于这些数据创建 Azure VM。
  3. 最新:如果选择了最新的恢复点,则会基于发送到服务的数据创建恢复点。
  4. 开始:此步骤使用上一步骤中处理的数据创建 Azure 虚拟机。

故障转移时间

在以下情况下,故障转移需要执行额外的中间步骤,这通常需要花费大约 8 到 10 分钟才能完成:

  • VMware VM 运行的移动服务版本低于 9.8
  • 物理服务器
  • VMware Linux VM
  • 作为物理服务器受到保护的 Hyper-V VM
  • 其中的下列驱动程序不是启动驱动程序的 VMware VM:
    • storvsc
    • vmbus
    • storflt
    • intelide
    • atapi
  • 未启用 DHCP 的 VMware VM,无论它们使用的是 DHCP 还是静态 IP 地址。

在其他所有情况下,不需要执行中间步骤,因此故障转移花费的时间大大减少。

创建用于测试故障转移的网络

对于测试故障转移,我们建议选择与每个 VM 的“计算和网络”设置中指定的生产恢复站点网络相互独立的网络。 默认情况下,创建 Azure 虚拟网络时,该网络独立于其他网络。 测试网络应模拟生产网络:

  • 测试网络中的子网数目应与生产网络中的子网数目相同。 这些子网的名称应该相同。
  • 测试网络应使用相同的 IP 地址范围。
  • 使用“计算和网络”设置中为 DNS VM 指定的 IP 地址更新测试网络的 DNS。 有关更多详细信息,请参阅 Active Directory 的测试性故障转移注意事项

在恢复站点中执行到生产网络的测试故障转移

尽管我们建议选择与生产网络不同的测试网络,但是,如果确实想要测试到生产网络的灾难恢复演练,请注意以下几点:

  • 确保在运行测试故障转移时主 VM 已关闭。 否则,同一网络中会同时运行两个具有相同标识的 VM。 这可能会导致意外的后果。
  • 清理故障转移时,为测试故障转移创建的 VM 发生的任何更改都会丢失。 这些更改不会复制回到主 VM。
  • 在生产环境中执行测试会导致生产应用程序关闭。 测试故障转移正在进行时,用户不应使用 VM 上运行的应用。

准备 Active Directory 和 DNS

若要运行测试故障转移以进行应用程序测试,需在测试环境中创建 Active Directory 生产环境的副本。 有关详细信息,请参阅 Active Directory 的测试性故障转移注意事项

准备在故障转移后连接到 Azure VM

如果想要在故障转移后使用 RDP/SSH 连接到 Azure VM,请遵照表格中汇总的要求。

故障转移 位置 操作
运行 Windows 的 Azure VM 故障转移之前的本地计算机 若要通过 Internet 访问 Azure VM,请启用 RDP,并确保已针对“公共” 添加 TCP 和 UDP 规则,并在“Windows 防火墙” >“允许的应用” 中针对所有配置文件允许 RDP。

若要通过站点到站点连接访问 Azure VM,请在计算机上启用 RDP,并确保在“Windows 防火墙”->“允许的应用和功能”中针对“域和专用”网络允许 RDP。

确保操作系统 SAN 策略已设置为 OnlineAll了解详细信息

在触发故障转移时,请确保 VM 上没有处于挂起状态的 Windows 更新。 Windows 更新可能会在故障转移时启动,在更新完成之前,无法登录到 VM。
运行 Windows 的 Azure VM 故障转移之后在 Azure VM 上 为 VM 添加公共 IP 地址

已故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则需要允许与 RDP 端口建立传入连接。

选中“启动诊断”可查看 VM 的屏幕截图。

如果无法连接,请检查 VM 是否正在运行,并查看这些故障排除提示
运行 Linux 的 Azure VM 故障转移之前的本地计算机 确保 VM 上的安全外壳服务已设置为在系统引导时自动启动。

确保防火墙规则允许 SSH 连接。
运行 Linux 的 Azure VM 故障转移之后在 Azure VM 上 已故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则需要允许与 SSH 端口建立传入连接。

为 VM 添加公共 IP 地址

选中“启动诊断”可查看 VM 的屏幕截图 。

请按照此处所述的步骤对故障转移后的任何连接问题进行故障排除。

后续步骤

完成灾难恢复演练后,详细了解其他类型的故障转移