Azure 到 Azure 的灾难恢复体系结构
本文介绍使用 Azure Site Recovery 服务为 Azure 虚拟机 (VM) 部署灾难恢复时所用的体系结构、组件和过程。 设置好灾难恢复后,Azure VM 就可以持续复制到不同的目标区域。 如果发生服务中断,可将 VM 故障转移到次要区域,然后在次要区域中对其进行访问。 一切恢复正常后,可以执行故障回复,继续在主要位置操作。
体系结构组件
下表汇总了 Azure VM 灾难恢复所涉及的组件。
组件 | 要求 |
---|---|
源区域中的 VM | 受支持源区域中的一个或多个 Azure VM。 VM 可以运行任何受支持的操作系统。 |
源 VM 存储 | 可以管理 Azure VM;它们还可以包含分散在不同存储帐户之间的非托管磁盘。 了解支持的 Azure 存储。 |
源 VM 网络 | VM 可以位于源区域中虚拟网络 (VNet) 上的一个或多个子网内。 详细了解网络要求。 |
缓存存储帐户 | 源网络中需要一个缓存存储帐户。 在复制期间,VM 更改将存储在缓存中,然后再发送到目标存储。 使用缓存可确保尽量减少对 VM 上运行的生产应用程序造成的影响。 详细了解缓存存储要求。 |
目标资源 | 在复制期间以及发生故障转移时将使用目标资源。 Site Recovery 默认可以设置目标资源,你也可以自行创建/自定义目标资源。 在目标区域中,请检查是否能够创建 VM,以及你的订阅是否有足够的资源用于支持目标区域中所需的 VM 大小。 |
目标资源
为 VM 启用复制时,Site Recovery 将提供用于自动创建目标资源的选项。
目标资源 | 默认设置 |
---|---|
目标订阅 | 与源订阅相同。 |
目标资源组 | VM 在故障转移后所属的资源组。 该组可以位于除源区域以外的其他任何 Azure 区域。 Site Recovery 将在目标区域中创建一个带有“asr”后缀的新资源组。 |
目标 VNet | 复制的 VM 在故障转移后所处的虚拟网络 (VNet)。 创建源虚拟网络与目标虚拟网络之间的网络映射,反之亦然。 Site Recovery 将创建带有“asr”后缀的新 VNet 和子网。 |
目标存储帐户 | 如果 VM 不使用托管磁盘,则会将数据复制到此存储帐户。 Site Recovery 将在目标区域中创建新的存储帐户,以镜像源存储帐户。 |
副本托管磁盘 | 如果 VM 使用托管磁盘,则会将数据复制到此副本托管磁盘。 Site Recovery 将在存储区域中创建副本托管磁盘用于镜像源。 |
目标可用性集 | 复制的 VM 在故障转移后所处的可用性集。 对于源位置中某个可用性集内的 VM,Site Recovery 将在目标区域中创建一个带有“asr”后缀的可用性集。 如果存在某个可用性集,则会使用该可用性集,而不会新建。 |
管理目标资源
可按如下所述管理目标资源:
- 启用复制时可以修改目标设置。 注意,目标区域 VM 的默认 SKU 与源 VM 的 SKU(或仅次于源 VM SKU 的最佳可用 SKU)相同。 下拉列表仅显示与源 VM(第 1 代或第 2 代)属于同一系列的相关 SKU。
- 已开始复制后可以修改目标设置。 与目标资源组、目标名称和其他资源类似,目标区域 VM SKU 也可以在复制期间进行更新。 可用性类型(单一实例或集)是无法更新的资源。 若要更改此设置,需要禁用复制、修改设置,然后重新启用复制。
复制策略
启用 Azure VM 复制时,Site Recovery 默认会使用下表中汇总的默认设置创建新的复制策略。
策略设置 | 详细信息 | 默认 |
---|---|---|
恢复点保留期 | 指定 Site Recovery 保留恢复点的时间长短。 | 1 天 |
应用一致性快照频率 | Site Recovery 创建应用一致性快照的频率。 | 0 小时(已禁用) |
管理复制策略
可按如下所述管理和修改默认的复制策略设置:
- 启用复制时可以修改设置。
- 随时可以创建复制策略,并在启用复制时应用该策略。
注意
恢复点保持期的值过高可能会影响存储成本,因为可能需要保存更多的恢复点。
多 VM 一致性
如果希望 VM 一同复制,并在故障转移时获得共享的崩溃一致性和应用一致性恢复点,可将这些 VM 集中到一个复制组中。 多 VM 一致性会影响工作负荷的性能。仅当 VM 运行的工作负荷需要在所有计算机之间保持一致时,才应该对这些 VM 使用此功能。
快照和恢复点
恢复点是基于在特定时间点生成的 VM 磁盘快照创建的。 故障转移 VM 时,可以使用恢复点来还原目标位置中的 VM。
故障转移时,我们通常想要确保 VM 在不发生任何数据损坏或丢失的情况下启动,并且 VM 数据可在操作系统以及 VM 上运行的应用中保持一致。 这取决于创建的快照类型。
Site Recovery 按如下所述创建快照:
- 默认情况下,Site Recovery 创建崩溃一致性数据快照;如果指定了频率,则创建应用一致性快照。
- 恢复点是基于快照创建的,根据复制策略中的保留期设置进行存储。
一致性
下表解释了不同的一致性类型。
崩溃一致性
说明 | 详细信息 | 建议 |
---|---|---|
崩溃一致性快照捕获创建快照时磁盘上的数据。 它不包括内存中的任何数据。 崩溃一致性快照包含在 VM 发生崩溃或者在创建快照的那一刻从服务器上拔下电源线时,磁盘上的等量数据。 崩溃一致性不能保证操作系统或 VM 上的应用中的数据一致性。 |
默认情况下,Site Recovery 每隔五分钟创建崩溃一致性恢复点。 此设置不可修改。 |
目前,大多数应用都可以从崩溃一致性恢复点正常恢复。 对于操作系统以及 DHCP 服务器和打印服务器等应用而言,崩溃一致性恢复点已足够。 |
应用一致性
说明 | 详细信息 | 建议 |
---|---|---|
应用一致性恢复点是基于应用一致性快照创建的。 应用一致性快照包含崩溃一致性快照中的所有信息,此外加上内存中的数据,以及正在进行的事务中的数据。 |
应用一致性快照使用卷影复制服务 (VSS): 1) Azure Site Recovery 使用仅复制备份 (VSS_BT_COPY) 方法,该方法不会更改 Azure SQL 的事务日志备份时间和序列号 2) 启动快照时,VSS 将对卷执行写时复制 (COW) 操作。 3) 执行 COW 之前,VSS 会告知计算机上的每个应用它需要将内存常驻数据刷新到磁盘。 4) 然后,VSS 允许备份/灾难恢复应用(在本例中为 Site Recovery)读取快照数据并继续处理。 |
应用一致性快照是按指定的频率创建的。 此频率始终应小于为保留恢复点设置的频率。 例如,如果使用默认设置 24 小时保留恢复点,则应将频率设置为小于 24 小时。 应用一致性快照比崩溃一致性快照更复杂,且完成时间更长。 应用一致性快照会影响已启用复制的 VM 上运行的应用的性能。 |
复制过程
为 Azure VM 启用复制时,会发生以下情况:
- 自动在 VM 上安装 Site Recovery 移动服务扩展。
- 该扩展将 VM 注册到 Site Recovery。
- 开始 VM 的持续复制。 磁盘写入内容立即传输到源位置中的缓存存储帐户。
- Site Recovery 处理缓存中的数据,并将其发送到目标存储帐户或副本托管磁盘。
- 处理数据后,每隔五分钟生成崩溃一致性恢复点。 根据复制策略中指定的设置生成应用一致性恢复点。
复制过程
连接要求
复制的 Azure VM 需要出站连接。 Site Recovery 不必与 VM 建立入站连接。
出站连接 (URL)
如果使用 URL 控制 VM 的出站访问,请允许这些 URL。
名称 | Azure 中国世纪互联 | 说明 |
---|---|---|
存储 | *.blob.core.chinacloudapi.cn |
允许将数据从 VM 写入源区域中的缓存存储帐户。 |
Microsoft Entra ID | login.chinacloudapi.cn |
向 Site Recovery 服务 URL 提供授权和身份验证。 |
复制 | *.hypervrecoverymanager.windowsazure.cn |
允许 VM 与 Site Recovery 服务进行通信。 |
服务总线 | *.servicebus.chinacloudapi.cn |
允许 VM 写入 Site Recovery 监视和诊断数据。 |
Key Vault | *.vault.azure.cn |
允许访问,以便通过门户为支持 ADE 的虚拟机启用复制 |
Azure 自动化 | *.azure-automation.cn |
允许通过门户为复制项启用移动代理自动升级 |
IP 地址范围的出站连接
若要使用 IP 地址控制 VM 的出站连接,请允许这些地址。 注意,可以在网络白皮书中找到网络连接要求的详细信息。
源区域规则
规则 | 详细信息 | 服务标记 |
---|---|---|
允许 HTTPS 出站通信:端口 443 | 允许对应于源区域中存储帐户的范围 | 存储 |
允许 HTTPS 出站通信:端口 443 | 允许对应于 Microsoft Entra ID 的范围 | AzureActiveDirectory |
允许 HTTPS 出站通信:端口 443 | 允许与目标区域中的事件中心对应的范围。 | EventHub |
允许 HTTPS 出站通信:端口 443 | 允许与 Azure Site Recovery 对应的范围 | AzureSiteRecovery |
允许 HTTPS 出站通信:端口 443 | 允许与 Azure Key Vault 对应的范围(仅在通过门户为支持 ADE 的虚拟机启用复制时才需要这样做) | AzureKeyVault |
允许 HTTPS 出站通信:端口 443 | 允许与 Azure 自动化控制器对应的范围(仅在通过门户为复制项启用移动代理自动升级时才需要这样做) | GuestAndHybridManagement |
目标区域规则
规则 | 详细信息 | 服务标记 |
---|---|---|
允许 HTTPS 出站通信:端口 443 | 允许对应于目标区域中存储帐户的范围。 | 存储 |
允许 HTTPS 出站通信:端口 443 | 允许对应于 Microsoft Entra ID 的范围 | AzureActiveDirectory |
允许 HTTPS 出站通信:端口 443 | 允许与源区域中的事件中心对应的范围。 | EventHub |
允许 HTTPS 出站通信:端口 443 | 允许与 Azure Site Recovery 对应的范围 | AzureSiteRecovery |
允许 HTTPS 出站通信:端口 443 | 允许与 Azure Key Vault 对应的范围(仅在通过门户为支持 ADE 的虚拟机启用复制时才需要这样做) | AzureKeyVault |
允许 HTTPS 出站通信:端口 443 | 允许与 Azure 自动化控制器对应的范围(仅在通过门户为复制项启用移动代理自动升级时才需要这样做) | GuestAndHybridManagement |
使用网络安全组规则控制访问
如果使用网络安全组规则通过筛选传入和传出 Azure 网络/子网的网络流量来控制 VM 连接,请注意以下要求:
- 源 Azure 区域的网络安全组规则应允许复制流量进行出站访问。
- 我们建议先在测试环境中创建规则,然后在生产环境中实施这些规则。
- 使用服务标记,而不要允许单个 IP 地址。
- 服务标记表示集合在一起的一组 IP 地址前缀,可以最大程度地降低安全规则创建过程的复杂性。
- Azure 会不断地自动更新服务标记。
详细了解 Site Recovery 的出站连接,以及如何使用网络安全组控制连接。
多 VM 一致性的连接
如果启用了多 VM 一致性,则复制组中的计算机将通过端口 20004 相互通信。
- 请确保没有防火墙设备阻止 VM 之间通过端口 20004 进行的内部通信。
- 如果想要 Linux VM 成为复制组的一部分,请确保按照特定 Linux 版本的指南手动打开端口 20004 上的出站流量。
故障转移过程
如果启动故障转移,系统会在目标资源组、目标虚拟网络、目标子网和目标可用性集中创建 VM。 可在故障转移过程中使用任意恢复点。
后续步骤
- 将 Azure VM 快速复制到次要区域。