Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
本文综述了使用 Azure Site Recovery - 现代化在灾难恢复期间将本地机器故障转移到 Azure 及故障恢复的过程。
有关Azure Site Recovery经典版本中的故障转移和故障恢复的信息,请参阅本文。
恢复阶段
Site Recovery中的故障切换和故障恢复有四个阶段:
- Stage 1:从本地故障转移:在将本地计算机的复制设置到 Azure 后,当本地站点出现故障时,将这些计算机故障转移到 Azure。 故障转移后,Azure 会根据复制的数据创建虚拟机。
- Stage 2:重新保护Azure VM:在Azure中,重新保护Azure VM,以便它们开始复制回本地站点。 重新保护期间,为帮助确保数据一致性,本地 VM(如果可用)将会关闭。
- 阶段 3:从 Azure 进行故障转移:当本地站点再次正常运行时,请再次执行故障转移。 您需要将 Azure 虚拟机回切到本地站点。 可以故障恢复到故障切换的原始位置,或者故障恢复到替代位置。 此活动被称为 计划内故障转移。
- Stage 4:重新保护本地计算机:故障回复后,再次启用对本地计算机到Azure的复制。
故障转移
在业务连续性和灾难恢复(BCDR)策略中执行故障转移。
- 作为 BCDR 策略的第一步,请持续将本地计算机复制到Azure。 用户访问本地源计算机上运行的工作负载和应用程序。
- 如果需要,例如,在本地出现中断时,将正在复制的计算机切换到 Azure。 Azure VM 是使用复制的数据创建的。
- 为了保持业务连续性,用户可以继续访问Azure VM 上的应用。
故障转移是分为两个阶段的活动:
- Failover:使用所选恢复点创建和启动Azure VM 的故障转移。
-
Commit:故障转移后验证Azure中的 VM:
- 然后,您可以将故障转移提交至所选的恢复点,或选择另一个恢复点进行提交。
- 在提交故障转移后,恢复点将无法更改。
注释
对于Windows Server 2012或更旧版本,应使用崩溃一致性恢复点,因为在这些版本中,应用程序一致性恢复点可能会导致故障转移VM的启动时间更长。
故障转移后连接到Azure
若要使用 RDP 或 SSH 连接到在故障转移后创建的Azure VM,需要满足多种要求。
| 故障转移 | 位置 | 行动 |
|---|---|---|
| 运行 Windows 的 Azure VM | 在故障转移之前的本地计算机上 | 通过互联网访问:启用 RDP。 确保已针对“公共”添加了 TCP 和 UDP 规则,并确保在“Windows 防火墙”“允许的应用”中针对所有配置文件允许 RDP 。 通过站点到站点 VPN 访问:在计算机上启用 RDP。 检查在Windows 防火墙的>允许的应用和功能中,是否已为域和专用网络允许 RDP。 确保操作系统 SAN 策略已设置为 OnlineAll。 了解详细信息。 当您触发故障转移时,请确保 VM 上没有未完成的 Windows 更新。 Windows Update 可能会在进行故障转移时自动启动,并且在更新完成之前您将无法登录 VM。 |
| 运行 Windows 的 Azure VM | 故障转移后在Azure VM 上 |
为 VM 添加公共 IP 地址。 发生故障转移的虚拟机上的网络安全组规则(及其连接的 Azure 子网)必须允许到 RDP 端口的传入连接。 选中“启动诊断”可查看 VM 的屏幕截图 。 如果无法连接,请检查 VM 是否正在运行,并查看故障排除提示。 |
| 运行 Linux 的 Azure VM | 在故障转移之前的本地计算机上 | 确保 VM 上的安全外壳服务已设置为在系统引导时自动启动。 确保防火墙规则允许 SSH 连接。 |
| 运行 Linux 的 Azure VM | 故障转移后在Azure VM 上 | 故障转移 VM 上的网络安全组规则(及其连接的Azure子网)需要允许到 SSH 端口的传入连接。 为 VM 添加公共 IP 地址。 选中“启动诊断”可查看 VM 的屏幕截图 。 |
故障转移类型
Site Recovery提供了不同的故障转移选项。
| 故障转移 | 详细信息 | 恢复 | 工作流 |
|---|---|---|---|
| 测试故障转移 | 用于运行验证 BCDR 策略的演练,而不会造成任何数据丢失或停机。 | 在Azure中创建 VM 的副本,不会影响正在进行的复制,也不会影响生产环境。 | 1.针对单个 VM 或恢复计划中的多个 VM 运行测试故障转移。 2.选择用于测试故障转移的恢复点。 3.选择Azure网络,Azure VM 在故障转移后创建时将位于其中。 该网络仅用于测试故障转移。 4.验证演练是否按预期方式进行。 Site Recovery在演练期间自动清理在Azure中创建的 VM。 |
| 计划内故障转移 - Hyper-V | 用于计划内停机。 源虚拟机已关闭。 在启动故障转移之前,将同步最新的数据。 |
计划的工作流不会发生任何数据丢失。 | 1.规划停机维护时段并通知用户。 2. 使面向用户的应用下线。 使用最新的恢复点启动计划的故障转移。 如果计算机未关闭或遇到错误,则故障转移不会运行。 4. 故障转移后,检查 Azure VM 副本在 Azure 环境中是否处于活动状态。 5.提交故障转移以完成操作。 提交操作将删除所有恢复点。 |
| 故障转移 - Hyper-V | 通常在出现计划外服务中断或主站点不可用的情况时运行。 (可选)在启动故障转移之前关闭 VM 并同步最终更改。 |
应用只会出现极少量的数据丢失。 | 1. 启动 BCDR 计划。 2. 启动故障转移。 指定Site Recovery在触发故障转移之前是否应关闭 VM 并同步或复制最新更改。 3. 您可以在众多恢复点选项之间进行故障转移,详细信息汇总在此处。 如果未启用关闭 VM 的选项,或者如果Site Recovery无法将其关闭,则使用最新的恢复点。 即使计算机无法关闭,故障转移仍会运行。 4. 故障转移后,检查 Azure VM 副本是否在 Azure 中处于活动状态。 如果需要,可以从 24 小时保留时段中选择不同的恢复点。 5.提交故障转移以完成操作。 提交操作将删除所有可用的恢复点。 |
| 故障转移 - VMware | 通常在出现计划外服务中断或主站点不可用的情况时运行。 (可选)指定Site Recovery应尝试触发 VM 关闭,并在启动故障转移之前同步和复制最终更改。 |
应用只会出现极少量的数据丢失。 | 1. 启动 BCDR 计划。 2. 从站点恢复系统(Site Recovery)发起故障转移。 指定 Site Recovery 是否应在运行故障转移之前尝试触发 VM 关闭和同步。 即使无法关闭这些计算机,故障转移过程仍会运行。 3. 故障转移后,检查副本 Azure VM 是否在 Azure 中处于活动状态。 若有必要,可以从 72 小时保留时段中选择不同的恢复点。 5.提交故障转移以完成操作。 提交操作将删除所有恢复点。 对于 Windows 虚拟机,在故障转移时,Site Recovery 会禁用 VMware 工具。 |
| 计划内故障转移 - VMware | 可以执行从Azure到本地的计划内故障转移。 | 由于它是计划的故障转移活动,因此在触发计划的故障转移作业后会生成恢复点。 | 当计划的故障转移被触发时,待处理的更改将复制到本地,生成了 VM 的最新恢复点,然后 Azure VM 关闭并终止运行。 按照 here 所述执行故障转移过程。 在此之后,本地计算机将启动。 成功进行计划的故障转移操作完成后,计算机将在您的本地环境中处于活动状态。 |
故障转移处理
在某些情况下,故障转移需要大约 8 到 10 分钟的时间来完成额外处理步骤。 在以下情况中,你可能会注意到测试故障转移的时间较长:
- 未启用 DHCP 服务的 VMware VM。
- VMware VM 不包含以下启动驱动程序:storvsc、vmbus、storflt、intelide、atapi。
恢复点选项
在故障转移过程中,您可以选择多个恢复点的选项。
| 选项 | 详细信息 |
|---|---|
| 最新(最低 RPO) | 此选项提供最低的恢复点目标 (RPO)。 它首先处理Site Recovery服务接收的所有数据,以便在故障转移之前为每个 VM 创建恢复点。 它最初尝试处理并应用Site Recovery服务在目标位置接收的所有数据,并使用已处理的数据创建恢复点。 但是,如果在触发故障转移时,没有上传到等待处理的Site Recovery服务的数据,Azure Site Recovery不会执行任何处理,因此不会创建新的恢复点。 在此场景中,它仅通过使用以前处理的恢复点来进行故障转移。 |
| 最新处理 | 此选项将 VM 切换到由 Site Recovery 处理的最新恢复点。 若要查看特定 VM 的最新恢复点,请检查 VM 设置中的“最新恢复点”。 此选项提供低 RTO(恢复时间目标),因为无需费时处理未经处理的数据。 |
| 最新应用一致性 | 如果启用了应用一致性恢复点,此选项会将 VM 故障转移到由Site Recovery处理的最新应用程序一致性恢复点。 在 VM 设置中检查最新的恢复点。 |
| 最新处理的多 VM 系统 | 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 已启用该设置的 VM 会故障转移到最新的多 VM 共同一致恢复点。 计划中的其余虚拟机故障转移到最新处理的恢复点。 |
| 最新的多虚拟机应用程序一致性 | 此选项适用于包含一个或多个已启用多 VM 一致性的 VM 的恢复计划。 属于复制组的 VM 会故障转移到最新的常用多 VM 应用程序一致恢复点。 其他虚拟机故障转移到其最新的应用程序一致的恢复点。 |
| 自定义 | 使用此选项可将特定 VM 故障转移到特定的恢复点。 此选项不适用于恢复计划。 |
注释
无法将恢复点迁移到另一个恢复服务保管库。
重新保护和计划的故障转移
故障转移到Azure后,复制的Azure VM 处于不受保护状态。
- 若要启动故障回复到本地站点的过程,需要开始将 Azure 虚拟机 复制到本地。 重新保护过程取决于故障转移的计算机的类型。
- 将机器从Azure复制到本地环境后,可以运行从Azure到本地环境的故障转移过程。
- 再次在本地运行计算机后,可以启用复制,以便将其复制到Azure进行灾难恢复。
- 在重新保护操作期间,只有从本地复制到 Azure 的磁盘会从 Azure 复制回。 新添加到故障转移的 Azure 虚拟机的磁盘不会复制到本地机器。
- 一个设备最多可以连接 60 个磁盘。 如果您正在回切的虚拟机总共有超过 60 个磁盘,或者正在回切大量流量,请创建一个单独的应用设备用于回切。
计划故障转移的工作方式如下:
- 若要将故障回复到本地,VM 至少需要一个恢复点才能进行故障回复。 恢复计划中的所有 VM 至少需有一个恢复点。
- 由于这是计划的故障转移活动,您可以选择要回退到的恢复点类型。 使用崩溃一致性点。
- 还有应用一致性恢复点选项。 在这种情况下,单个 VM 将恢复到其最新可用的应用一致性恢复点。 对于包含复制组的恢复计划,每个复制组将恢复到其公共的可用恢复点。
- 应用一致性恢复点在时间上可能会落后,并且可能会发生数据丢失。
- 在从 Azure 切换到本地站点期间,Site Recovery 会关闭 Azure 虚拟机。 提交故障转移后,Site Recovery 会删除 Azure 中回滚故障的虚拟机。
注释
使用崩溃一致性恢复点时,在 Windows Server 2012 或更早的版本上,故障转移 VM 启动可能需要更长的时间。
VMware 和物理服务器再保护与故障回退
若要将 VMware 计算机和物理服务器从 Azure 重新保护并进行故障恢复到本地,请确保您的设备状态良好。
设备选择
- 选择在保管库下注册的任何 Azure Site Recovery 复制设备,以便重新保护本地系统。 在 Azure 中,不需要单独的进程服务器来执行重新保护操作,也不需要适用于 Linux VM 的横向扩展主目标服务器。
- 复制设备在故障恢复期间不需要另一个网络连接或端口(与正向保护相比)。 如果设备处于正常状态,则可以使用相同的设备进行向前和向后保护。 它不应影响复制的性能。
- 选择设备时,请确保设备可以access源计算机所在的目标数据存储。 始终应使设备访问源计算机的数据存储。 即使计算机和设备位于不同的 ESX 服务器中,只要数据存储在两者之间共享,重新保护也会成功。
注释
- 不支持对复制项进行 Storage vMotion。 重新保护作业后不支持复制应用设备的 Storage vMotion。
- 选择设备时,请确保设备可以访问源计算机所在的目标数据存储。
重新保护作业
- 如果此作业是新的重新保护操作,Azure Site Recovery 默认情况下会在目标区域自动创建新的日志存储帐户。 不需要保留磁盘。
- 在备用位置恢复和原始位置恢复中,检索源计算机的原始配置。
注释
- 如果备用位置重新保护(ALR)或原始位置重新保护(OLR),则无法保留静态 IP 地址。
- fstab 和 LVMconf 文件已更改。
失败
- 可以重试任何失败的重新保护作业。 重试期间,你可以选择任何正常运行的复制设备。
将Azure计算机重新保护到本地时,系统会通知你故障回复到原始位置或备用位置。
Original 位置恢复:该操作在源本地计算机存在的情况下,从 Azure 回退到同一台计算机。 在这种情况下,只会将更改复制回到本地。
- OLR 期间选择数据存储:会自动选择附加在源计算机上的数据存储。
备用位置恢复:如果本地计算机不存在,则可以从 Azure 回退到备用位置。 将Azure VM 重新保护到本地时,将创建本地计算机。 从Azure到本地进行完整数据复制。 查看位置故障回复的要求和限制。
- ALR 期间选择数据存储:可以选择由设备所在的 vCenter 管理的任何数据存储,并且设备可访问(读取和写入权限)。 可以选择原始或新的数据存储。 可以选择用于重新保护的缓存存储帐户。
故障转移完成后,Azure VM 中的移动代理会自动注册 站点恢复服务。 如果注册失败,则会在故障转移的 VM 上引发严重运行状况问题。 解决问题后,会自动触发注册。 解决错误后,你可以手动完成注册。
取消故障转移
如果本地环境尚未准备就绪,或者面临任何挑战,您可以取消故障转移。
当您启动计划的故障转移并成功完成后,您的本地环境将可供使用。 但在作完成后,如果要故障转移到其他恢复点,可以取消故障转移。
只能取消已计划的故障转移。
你可以从恢复服务保管库的“复制的项”页面取消计划的故障转移。
取消故障转移后,Azure 中的计算机将重新启动,复制将从 Azure 重新开始到本地。