Condividi tramite

关于本地灾难恢复转移和恢复 - 现代化版本

本文概述了在使用 Azure Site Recovery - 现代化版时,将本地计算机灾难恢复到 Azure 的过程中涉及的故障转移和故障回复过程。

有关 Azure Site Recovery 经典版中故障转移和故障恢复的信息,请参阅本文

恢复阶段

故障转移和故障回复在 Site Recovery 中有四个阶段:

  • 第 1 阶段:从本地故障转移:完成将本地主机复制到 Azure 的设置后,当本地站点发生故障时,将这些主机故障转移到 Azure。 故障转移后,将基于复制的数据创建 Azure 虚拟机。
  • 第 2 阶段:重新保护 Azure VM:在 Azure 中重新保护 Azure VM,使之开始复制回到本地站点。 重新保护期间,为帮助确保数据一致性,本地 VM(如果可用)将会关闭。
  • 阶段 3:从 Azure 向本地故障转移:当本地站点恢复正常运行后,请再次执行故障转移。 这一次,可将 Azure VM 故障回复到本地站点。 可以故障恢复到故障切换的原始位置,或者故障恢复到替代位置。 此活动被称为 计划内故障转移
  • 第 4 阶段:重新保护本地计算机:故障回复后,再次启用本地计算机到 Azure 的复制。

故障转移

在业务连续性和灾难恢复(BCDR)策略中执行故障转移。

  • 作为 BCDR 策略的第一步,请持续将本地计算机复制到 Azure。 用户访问本地源计算机上运行的工作负荷和应用。
  • 如果需要,例如,如果本地发生中断,则将复制的计算机切换到 Azure。 使用复制的数据创建 Azure VM。
  • 为实现业务连续性,用户可以继续访问 Azure VM 上的应用。

故障转移是分为两个阶段的活动:

  • 故障转移:使用所选恢复点创建并启动 Azure VM 的故障转移。
  • 确认:故障转移后,在 Azure 中验证虚拟机
    • 然后,您可以将故障转移提交至所选的恢复点,或选择另一个恢复点进行提交。
    • 在提交故障转移后,恢复点将无法更改。

注释

使用 Windows Server 2012 或更早版本的崩溃一致性恢复点,因为对于这些版本,使用应用程序一致性恢复点可能导致故障转移 VM 的启动时间更长。

故障转移后连接到 Azure

若要使用 RDP 或 SSH 连接到故障转移后创建的 Azure VM,有几个要求。

故障转移 位置 行动
运行 Windows 的 Azure VM 在故障转移之前的本地计算机上 通过 Internet 访问:启用 RDP。 确保已针对“公共”添加了 TCP 和 UDP 规则,并确保在“Windows 防火墙”“允许的应用”中针对所有配置文件允许 RDP 。

通过站点到站点 VPN 访问:在计算机上启用 RDP。 检查在Windows 防火墙的>允许的应用和功能中,是否已为域和专用网络允许 RDP。

确保操作系统 SAN 策略已设置为 OnlineAll了解详细信息

当您触发故障转移时,请确保 VM 上没有未完成的 Windows 更新。 Windows 更新可能会在故障转移时启动,在更新完成之前,你将无法登录到 VM。
运行 Windows 的 Azure VM 故障转移之后在 Azure VM 上 为 VM 添加公共 IP 地址

故障转移后的 VM 及其所连接的 Azure 子网上的网络安全组规则必须允许与 RDP 端口建立传入连接。

选中“启动诊断”可查看 VM 的屏幕截图 。 如果无法连接,请检查 VM 是否正在运行,并查看故障排除提示
运行 Linux 的 Azure VM 在故障转移之前的本地计算机上 确保 VM 上的安全外壳服务已设置为在系统引导时自动启动。

确保防火墙规则允许 SSH 连接。
运行 Linux 的 Azure VM 故障转移之后在 Azure VM 上 已进行故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则需要允许与 SSH 端口建立传入连接。

为 VM 添加公共 IP 地址

选中“启动诊断”可查看 VM 的屏幕截图 。

故障转移类型

Site Recovery 提供不同的故障转移选项。

故障转移 详细信息 恢复 工作流
测试故障转移 用于运行验证 BCDR 策略的演练,而不会造成任何数据丢失或停机。 在 Azure 中创建 VM 的副本,这不会对进行中的复制或生产环境造成任何影响。 1.针对单个 VM 或恢复计划中的多个 VM 运行测试故障转移。

2.选择用于测试故障转移的恢复点。

3. 选择一个 Azure 网络,以便在故障转移后创建 Azure VM 时将其放入其中。 该网络仅用于测试故障转移。

4.验证演练是否按预期方式进行。 Site Recovery 将自动清理演练期间在 Azure 中创建的 VM。
计划内故障转移 - Hyper-V 用于计划内停机。

源虚拟机已关闭。 在启动故障转移之前,将同步最新的数据。
计划的工作流不会发生任何数据丢失。 1.规划停机维护时段并通知用户。

2. 使面向用户的应用下线。

使用最新的恢复点启动计划的故障转移。 如果计算机未关闭或遇到错误,则故障转移不会运行。

4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。

5.提交故障转移以完成操作。 提交操作将删除所有恢复点。
故障转移 - Hyper-V 通常在出现计划外服务中断或主站点不可用的情况时运行。

(可选)在启动故障转移之前关闭 VM 并同步最终更改。
应用只会出现极少量的数据丢失。 1. 启动 BCDR 计划。

2. 启动故障转移。 指定在触发故障转移之前,Site Recovery 是否应关闭 VM 并同步或复制最新更改。

3. 您可以在众多恢复点选项之间进行故障转移,详细信息汇总在此处

如果未启用关闭 VM 的选项,或者 Site Recovery 无法关闭 VM,则会使用最新的恢复点。
即使计算机无法关闭,故障转移仍会运行。

4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。
如果需要,可以从 24 小时保留时段中选择不同的恢复点。

5.提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。
故障转移 - VMware 通常在出现计划外服务中断或主站点不可用的情况时运行。

(可选)指定 Site Recovery 应尝试触发 VM 的关闭,并在启动故障转移之前同步和复制最终的更改。
应用只会出现极少量的数据丢失。 1. 启动 BCDR 计划。

2.从 Site Recovery 启动故障转移。 指定在运行故障转移之前,Site Recovery 是否应尝试触发 VM 关闭并进行同步。
即使无法关闭这些计算机,故障转移过程仍会运行。

3.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。
若有必要,可以从 72 小时保留时段中选择不同的恢复点。

5.提交故障转移以完成操作。 提交操作将删除所有恢复点。
对于 Windows VM,Site Recovery 在故障转移期间会禁用 VMware 工具。
计划内故障转移 - VMware 你可以执行从 Azure 到本地的计划性故障转移。 由于它是计划的故障转移活动,因此在触发计划的故障转移作业后会生成恢复点。 触发计划的故障转移时,未完成的更改将复制到本地环境,系统会在本地生成 VM 的最新恢复点,并关闭 Azure VM。

请按照此处所讨论的故障转移流程进行操作。 在此之后,本地计算机将启动。 成功进行计划的故障转移操作完成后,计算机将在您的本地环境中处于活动状态。

故障转移处理

在某些情况下,故障转移需要大约 8 到 10 分钟的时间来完成额外处理步骤。 在以下情况中,你可能会注意到测试故障转移的时间较长:

  • 未启用 DHCP 服务的 VMware VM。
  • VMware VM 不包含以下启动驱动程序:storvsc、vmbus、storflt、intelide、atapi。

恢复点选项

在故障转移过程中,您可以选择多个恢复点的选项。

选项 详细信息
最新(最低 RPO) 此选项提供最低的恢复点目标 (RPO)。 它首先处理 Site Recovery 服务接收到的所有数据,为每个 VM 创建恢复点,然后切换到相应的恢复点。 它最初尝试处理并应用 Site Recovery 服务在目标位置接收的所有数据,并使用已处理的数据创建恢复点。 但是,如果在触发故障转移时,没有上传到 Site Recovery 服务等待处理的数据,Azure Site Recovery 不会执行任何处理,因此不会创建新的恢复点。 在此场景中,它仅通过使用以前处理的恢复点来进行故障转移。
最新处理 此选项将 VM 故障转移到由 Site Recovery 处理的最新恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。 此选项提供低 RTO(恢复时间目标),因为无需费时处理未经处理的数据。
最新应用一致性 如果已启用应用一致性恢复点,此选项会将 VM 切换到由 Site Recovery 处理的最新应用一致性恢复点。 在 VM 设置中检查最新的恢复点。
最新处理的多 VM 系统 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 已启用该设置的 VM 会故障转移到最新的多 VM 共同一致恢复点。 计划中的其余虚拟机故障转移到最新处理的恢复点。
最新的多虚拟机应用程序一致性 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 属于复制组的 VM 会故障转移到最新的常用多 VM 应用程序一致恢复点。 其他虚拟机故障转移到其最新的应用程序一致的恢复点。
自定义 使用此选项可将特定 VM 故障转移到特定的恢复点。 此选项不适用于恢复计划。

注释

无法将恢复点迁移到另一个恢复服务保管库。

重新保护和计划的故障转移

故障转移到 Azure 后,复制的 Azure VM 处于不受保护状态。

  • 若要启动将 Azure 虚拟机切换回到本地站点的过程,需要开始将其复制到本地。 重新保护过程取决于故障转移的计算机的类型。
  • 当机器从 Azure 复制到本地之后,您可以执行从 Azure 故障转移到本地站点的操作。
  • 计算机再次在本地运行后,可以启用复制,以便将其复制到 Azure 进行灾难恢复。
  • 在重新保护操作期间,只有从本地复制到 Azure 的磁盘才会从 Azure 复制回来。 故障转移的 Azure VM 中新添加的磁盘不会复制到本地设备。
  • 一个设备最多可以连接 60 个磁盘。 如果您正在回切的虚拟机总共有超过 60 个磁盘,或者正在回切大量流量,请创建一个单独的应用设备用于回切。

计划故障转移的工作方式如下:

  • 若要将故障回复到本地,VM 至少需要一个恢复点才能进行故障回复。 恢复计划中的所有 VM 至少需有一个恢复点。
  • 由于这是计划的故障转移活动,您可以选择要回退到的恢复点类型。 使用崩溃一致性点。
    • 还有应用一致性恢复点选项。 在这种情况下,单个 VM 将恢复到其最新可用的应用一致性恢复点。 对于包含复制组的恢复计划,每个复制组将恢复到其公共的可用恢复点。
    • 应用一致性恢复点在时间上可能会落后,并且可能会发生数据丢失。
  • 从 Azure 故障转移到本地站点期间,Site Recovery 将关闭 Azure 虚拟机。 提交故障转移时,Site Recovery 将删除 Azure 中已故障回复的 Azure VM。

注释

使用崩溃一致性恢复点时,故障转移虚拟机启动在 Windows Server 2012 或更早版本上可能需时更久。

VMware 和物理服务器再保护与故障回退

若要将 VMware 计算机和物理服务器从 Azure 重新保护并恢复到本地,请确保设备健康运行。

设备选择

  • 选择在保管库下注册的任何 Azure Site Recovery 复制设备,以重新保护本地。 在 Azure 中,不需要单独的进程服务器进行重新保护操作,也不需要适用于 Linux 虚拟机的横向扩展主目标服务器。
  • 复制设备在故障恢复期间不需要另一个网络连接或端口(与正向保护相比)。 如果设备处于正常状态,则可以使用相同的设备进行向前和向后保护。 它不应影响复制的性能。
  • 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。 设备应始终访问源计算机的数据存储。 即使计算机和设备位于不同的 ESX 服务器中,只要数据存储在两者之间共享,重新保护也会成功。

    注释

    • 不支持复制项的存储 vMotion。 重新保护操作后不支持复制设备的存储 vMotion。
    • 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。

重新保护作业

  • 如果此作业是新的重新保护作,则默认情况下,Azure Site Recovery 会在目标区域中自动创建新的日志存储帐户。 不需要保留磁盘。
  • 在备用位置恢复和原始位置恢复中,检索源计算机的原始配置。

    注释

    • 如果备用位置重新保护(ALR)或原始位置重新保护(OLR),则无法保留静态 IP 地址。
    • fstab 和 LVMconf 文件已更改。

失败

  • 可以重试任何失败的重新保护作业。 重试期间,你可以选择任何正常运行的复制设备。

将 Azure 计算机重新恢复保护到本地时,系统会通知你正在回退到原始位置或备用位置。

  • 原始位置恢复:如果存在,此作将从 Azure 故障回复到同一源本地计算机。 在这种情况下,只会将更改复制回到本地。

    • OLR 期间选择数据存储:会自动选择附加在源计算机上的数据存储。
  • 备用位置恢复:如果本地计算机不可用,可以从 Azure 回切到备用位置。 在本地重新保护 Azure VM 时,将创建本地计算机。 将发生从 Azure 到本地的完整数据复制。 查看位置故障回复的要求和限制。

    • ALR 期间选择数据存储:可以选择由设备所在的 vCenter 管理的任何数据存储,并且设备可访问(读取和写入权限)。 可以选择原始或新的数据存储。 你可以选择用于重新保护的缓存存储帐户。
  • 故障转移完成后,Azure VM 中的移动代理会自动注册到 Site Recovery 服务。 如果注册失败,则会在故障转移的 VM 上引发严重运行状况问题。 解决问题后,会自动触发注册。 解决错误后,你可以手动完成注册。

取消故障转移

如果本地环境尚未准备就绪,或者面临任何挑战,您可以取消故障转移。

当您启动计划的故障转移并成功完成后,您的本地环境将可供使用。 但在作完成后,如果要故障转移到其他恢复点,可以取消故障转移。

  • 只能取消已计划的故障转移。

  • 你可以从恢复服务保管库的“复制的项”页面取消计划的故障转移。

  • 取消故障转移后,Azure 中的虚拟机将重新启动,并且复制将从 Azure 重新开始传输到本地服务器。

后续步骤