本文概述了在使用 Azure Site Recovery - 现代化版时,将本地计算机灾难恢复到 Azure 的过程中涉及的故障转移和故障回复过程。
有关 Azure Site Recovery 经典版中故障转移和故障恢复的信息,请参阅本文。
恢复阶段
故障转移和故障回复在 Site Recovery 中有四个阶段:
- 第 1 阶段:从本地故障转移:完成将本地主机复制到 Azure 的设置后,当本地站点发生故障时,将这些主机故障转移到 Azure。 故障转移后,将基于复制的数据创建 Azure 虚拟机。
- 第 2 阶段:重新保护 Azure VM:在 Azure 中重新保护 Azure VM,使之开始复制回到本地站点。 重新保护期间,为帮助确保数据一致性,本地 VM(如果可用)将会关闭。
- 阶段 3:从 Azure 向本地故障转移:当本地站点恢复正常运行后,请再次执行故障转移。 这一次,可将 Azure VM 故障回复到本地站点。 可以故障恢复到故障切换的原始位置,或者故障恢复到替代位置。 此活动被称为 计划内故障转移。
- 第 4 阶段:重新保护本地计算机:故障回复后,再次启用本地计算机到 Azure 的复制。
故障转移
在业务连续性和灾难恢复(BCDR)策略中执行故障转移。
- 作为 BCDR 策略的第一步,请持续将本地计算机复制到 Azure。 用户访问本地源计算机上运行的工作负荷和应用。
- 如果需要,例如,如果本地发生中断,则将复制的计算机切换到 Azure。 使用复制的数据创建 Azure VM。
- 为实现业务连续性,用户可以继续访问 Azure VM 上的应用。
故障转移是分为两个阶段的活动:
- 故障转移:使用所选恢复点创建并启动 Azure VM 的故障转移。
- 确认:故障转移后,在 Azure 中验证虚拟机。
- 然后,您可以将故障转移提交至所选的恢复点,或选择另一个恢复点进行提交。
- 在提交故障转移后,恢复点将无法更改。
注释
使用 Windows Server 2012 或更早版本的崩溃一致性恢复点,因为对于这些版本,使用应用程序一致性恢复点可能导致故障转移 VM 的启动时间更长。
故障转移后连接到 Azure
若要使用 RDP 或 SSH 连接到故障转移后创建的 Azure VM,有几个要求。
| 故障转移 | 位置 | 行动 |
|---|---|---|
| 运行 Windows 的 Azure VM | 在故障转移之前的本地计算机上 |
通过 Internet 访问:启用 RDP。 确保已针对“公共”添加了 TCP 和 UDP 规则,并确保在“Windows 防火墙”“允许的应用”中针对所有配置文件允许 RDP 。 通过站点到站点 VPN 访问:在计算机上启用 RDP。 检查在Windows 防火墙的>允许的应用和功能中,是否已为域和专用网络允许 RDP。 确保操作系统 SAN 策略已设置为 OnlineAll。 了解详细信息。 当您触发故障转移时,请确保 VM 上没有未完成的 Windows 更新。 Windows 更新可能会在故障转移时启动,在更新完成之前,你将无法登录到 VM。 |
| 运行 Windows 的 Azure VM | 故障转移之后在 Azure VM 上 | 为 VM 添加公共 IP 地址。 故障转移后的 VM 及其所连接的 Azure 子网上的网络安全组规则必须允许与 RDP 端口建立传入连接。 选中“启动诊断”可查看 VM 的屏幕截图 。 如果无法连接,请检查 VM 是否正在运行,并查看故障排除提示。 |
| 运行 Linux 的 Azure VM | 在故障转移之前的本地计算机上 | 确保 VM 上的安全外壳服务已设置为在系统引导时自动启动。 确保防火墙规则允许 SSH 连接。 |
| 运行 Linux 的 Azure VM | 故障转移之后在 Azure VM 上 | 已进行故障转移的 VM(及其连接到的 Azure 子网)上的网络安全组规则需要允许与 SSH 端口建立传入连接。 为 VM 添加公共 IP 地址。 选中“启动诊断”可查看 VM 的屏幕截图 。 |
故障转移类型
Site Recovery 提供不同的故障转移选项。
| 故障转移 | 详细信息 | 恢复 | 工作流 |
|---|---|---|---|
| 测试故障转移 | 用于运行验证 BCDR 策略的演练,而不会造成任何数据丢失或停机。 | 在 Azure 中创建 VM 的副本,这不会对进行中的复制或生产环境造成任何影响。 | 1.针对单个 VM 或恢复计划中的多个 VM 运行测试故障转移。 2.选择用于测试故障转移的恢复点。 3. 选择一个 Azure 网络,以便在故障转移后创建 Azure VM 时将其放入其中。 该网络仅用于测试故障转移。 4.验证演练是否按预期方式进行。 Site Recovery 将自动清理演练期间在 Azure 中创建的 VM。 |
| 计划内故障转移 - Hyper-V | 用于计划内停机。 源虚拟机已关闭。 在启动故障转移之前,将同步最新的数据。 |
计划的工作流不会发生任何数据丢失。 | 1.规划停机维护时段并通知用户。 2. 使面向用户的应用下线。 使用最新的恢复点启动计划的故障转移。 如果计算机未关闭或遇到错误,则故障转移不会运行。 4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 5.提交故障转移以完成操作。 提交操作将删除所有恢复点。 |
| 故障转移 - Hyper-V | 通常在出现计划外服务中断或主站点不可用的情况时运行。 (可选)在启动故障转移之前关闭 VM 并同步最终更改。 |
应用只会出现极少量的数据丢失。 | 1. 启动 BCDR 计划。 2. 启动故障转移。 指定在触发故障转移之前,Site Recovery 是否应关闭 VM 并同步或复制最新更改。 3. 您可以在众多恢复点选项之间进行故障转移,详细信息汇总在此处。 如果未启用关闭 VM 的选项,或者 Site Recovery 无法关闭 VM,则会使用最新的恢复点。 即使计算机无法关闭,故障转移仍会运行。 4.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 如果需要,可以从 24 小时保留时段中选择不同的恢复点。 5.提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。 |
| 故障转移 - VMware | 通常在出现计划外服务中断或主站点不可用的情况时运行。 (可选)指定 Site Recovery 应尝试触发 VM 的关闭,并在启动故障转移之前同步和复制最终的更改。 |
应用只会出现极少量的数据丢失。 | 1. 启动 BCDR 计划。 2.从 Site Recovery 启动故障转移。 指定在运行故障转移之前,Site Recovery 是否应尝试触发 VM 关闭并进行同步。 即使无法关闭这些计算机,故障转移过程仍会运行。 3.故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 若有必要,可以从 72 小时保留时段中选择不同的恢复点。 5.提交故障转移以完成操作。 提交操作将删除所有恢复点。 对于 Windows VM,Site Recovery 在故障转移期间会禁用 VMware 工具。 |
| 计划内故障转移 - VMware | 你可以执行从 Azure 到本地的计划性故障转移。 | 由于它是计划的故障转移活动,因此在触发计划的故障转移作业后会生成恢复点。 | 触发计划的故障转移时,未完成的更改将复制到本地环境,系统会在本地生成 VM 的最新恢复点,并关闭 Azure VM。 请按照此处所讨论的故障转移流程进行操作。 在此之后,本地计算机将启动。 成功进行计划的故障转移操作完成后,计算机将在您的本地环境中处于活动状态。 |
故障转移处理
在某些情况下,故障转移需要大约 8 到 10 分钟的时间来完成额外处理步骤。 在以下情况中,你可能会注意到测试故障转移的时间较长:
- 未启用 DHCP 服务的 VMware VM。
- VMware VM 不包含以下启动驱动程序:storvsc、vmbus、storflt、intelide、atapi。
恢复点选项
在故障转移过程中,您可以选择多个恢复点的选项。
| 选项 | 详细信息 |
|---|---|
| 最新(最低 RPO) | 此选项提供最低的恢复点目标 (RPO)。 它首先处理 Site Recovery 服务接收到的所有数据,为每个 VM 创建恢复点,然后切换到相应的恢复点。 它最初尝试处理并应用 Site Recovery 服务在目标位置接收的所有数据,并使用已处理的数据创建恢复点。 但是,如果在触发故障转移时,没有上传到 Site Recovery 服务等待处理的数据,Azure Site Recovery 不会执行任何处理,因此不会创建新的恢复点。 在此场景中,它仅通过使用以前处理的恢复点来进行故障转移。 |
| 最新处理 | 此选项将 VM 故障转移到由 Site Recovery 处理的最新恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。 此选项提供低 RTO(恢复时间目标),因为无需费时处理未经处理的数据。 |
| 最新应用一致性 | 如果已启用应用一致性恢复点,此选项会将 VM 切换到由 Site Recovery 处理的最新应用一致性恢复点。 在 VM 设置中检查最新的恢复点。 |
| 最新处理的多 VM 系统 | 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 已启用该设置的 VM 会故障转移到最新的多 VM 共同一致恢复点。 计划中的其余虚拟机故障转移到最新处理的恢复点。 |
| 最新的多虚拟机应用程序一致性 | 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 属于复制组的 VM 会故障转移到最新的常用多 VM 应用程序一致恢复点。 其他虚拟机故障转移到其最新的应用程序一致的恢复点。 |
| 自定义 | 使用此选项可将特定 VM 故障转移到特定的恢复点。 此选项不适用于恢复计划。 |
注释
无法将恢复点迁移到另一个恢复服务保管库。
重新保护和计划的故障转移
故障转移到 Azure 后,复制的 Azure VM 处于不受保护状态。
- 若要启动将 Azure 虚拟机切换回到本地站点的过程,需要开始将其复制到本地。 重新保护过程取决于故障转移的计算机的类型。
- 当机器从 Azure 复制到本地之后,您可以执行从 Azure 故障转移到本地站点的操作。
- 计算机再次在本地运行后,可以启用复制,以便将其复制到 Azure 进行灾难恢复。
- 在重新保护操作期间,只有从本地复制到 Azure 的磁盘才会从 Azure 复制回来。 故障转移的 Azure VM 中新添加的磁盘不会复制到本地设备。
- 一个设备最多可以连接 60 个磁盘。 如果您正在回切的虚拟机总共有超过 60 个磁盘,或者正在回切大量流量,请创建一个单独的应用设备用于回切。
计划故障转移的工作方式如下:
- 若要将故障回复到本地,VM 至少需要一个恢复点才能进行故障回复。 恢复计划中的所有 VM 至少需有一个恢复点。
- 由于这是计划的故障转移活动,您可以选择要回退到的恢复点类型。 使用崩溃一致性点。
- 还有应用一致性恢复点选项。 在这种情况下,单个 VM 将恢复到其最新可用的应用一致性恢复点。 对于包含复制组的恢复计划,每个复制组将恢复到其公共的可用恢复点。
- 应用一致性恢复点在时间上可能会落后,并且可能会发生数据丢失。
- 从 Azure 故障转移到本地站点期间,Site Recovery 将关闭 Azure 虚拟机。 提交故障转移时,Site Recovery 将删除 Azure 中已故障回复的 Azure VM。
注释
使用崩溃一致性恢复点时,故障转移虚拟机启动在 Windows Server 2012 或更早版本上可能需时更久。
VMware 和物理服务器再保护与故障回退
若要将 VMware 计算机和物理服务器从 Azure 重新保护并恢复到本地,请确保设备健康运行。
设备选择
- 选择在保管库下注册的任何 Azure Site Recovery 复制设备,以重新保护本地。 在 Azure 中,不需要单独的进程服务器进行重新保护操作,也不需要适用于 Linux 虚拟机的横向扩展主目标服务器。
- 复制设备在故障恢复期间不需要另一个网络连接或端口(与正向保护相比)。 如果设备处于正常状态,则可以使用相同的设备进行向前和向后保护。 它不应影响复制的性能。
- 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。 设备应始终访问源计算机的数据存储。 即使计算机和设备位于不同的 ESX 服务器中,只要数据存储在两者之间共享,重新保护也会成功。
注释
- 不支持复制项的存储 vMotion。 重新保护操作后不支持复制设备的存储 vMotion。
- 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。
重新保护作业
- 如果此作业是新的重新保护作,则默认情况下,Azure Site Recovery 会在目标区域中自动创建新的日志存储帐户。 不需要保留磁盘。
- 在备用位置恢复和原始位置恢复中,检索源计算机的原始配置。
注释
- 如果备用位置重新保护(ALR)或原始位置重新保护(OLR),则无法保留静态 IP 地址。
- fstab 和 LVMconf 文件已更改。
失败
- 可以重试任何失败的重新保护作业。 重试期间,你可以选择任何正常运行的复制设备。
将 Azure 计算机重新恢复保护到本地时,系统会通知你正在回退到原始位置或备用位置。
原始位置恢复:如果存在,此作将从 Azure 故障回复到同一源本地计算机。 在这种情况下,只会将更改复制回到本地。
- OLR 期间选择数据存储:会自动选择附加在源计算机上的数据存储。
备用位置恢复:如果本地计算机不可用,可以从 Azure 回切到备用位置。 在本地重新保护 Azure VM 时,将创建本地计算机。 将发生从 Azure 到本地的完整数据复制。 查看位置故障回复的要求和限制。
- ALR 期间选择数据存储:可以选择由设备所在的 vCenter 管理的任何数据存储,并且设备可访问(读取和写入权限)。 可以选择原始或新的数据存储。 你可以选择用于重新保护的缓存存储帐户。
故障转移完成后,Azure VM 中的移动代理会自动注册到 Site Recovery 服务。 如果注册失败,则会在故障转移的 VM 上引发严重运行状况问题。 解决问题后,会自动触发注册。 解决错误后,你可以手动完成注册。
取消故障转移
如果本地环境尚未准备就绪,或者面临任何挑战,您可以取消故障转移。
当您启动计划的故障转移并成功完成后,您的本地环境将可供使用。 但在作完成后,如果要故障转移到其他恢复点,可以取消故障转移。
只能取消已计划的故障转移。
你可以从恢复服务保管库的“复制的项”页面取消计划的故障转移。
取消故障转移后,Azure 中的虚拟机将重新启动,并且复制将从 Azure 重新开始传输到本地服务器。