物理服务器到 Azure 的灾难恢复体系结构 - 新式

本文介绍了使用 Azure Site Recovery 服务在本地站点与 Azure 之间对物理 Windows 和 Linux 服务器进行复制、故障转移和恢复时使用的新式版体系结构和过程。

若要了解经典版本中的配置服务器要求,请参阅物理服务器到 Azure 灾难恢复体系结构

注意

请确保创建新的恢复服务保管库以设置 ASR 复制设备。 请勿使用现有保管库。

体系结构组件

下面的表和图提供了用于将物理计算机灾难恢复到 Azure 的组件的概要视图。

Screenshot of Modernized architecture.

组件 要求 详细信息
Azure Azure 订阅、用于缓存的 Azure 存储帐户、托管磁盘和 Azure 网络。 从本地计算机复制的数据存储在 Azure 存储中。 运行从本地到 Azure 的故障转移时,将使用复制的数据创建 Azure VM。 创建 Azure VM 后,它们将连接到 Azure 虚拟网络。
Azure Site Recovery 复制设备 这是整个 Azure Site Recovery 本地基础结构的基本构建基块。

设备中的所有组件都与复制设备协调一致。 此服务监督所有端到端 Site Recovery 活动,包括监视受保护计算机的运行状况、数据复制、自动更新等。
该设备承载各种关键组件,例如:

代理服务器:此组件充当移动代理与云中 Site Recovery 服务之间的代理通道。 它确保生产工作负载不需要额外的 Internet 连接来生成恢复点。

发现的项: 此组件收集 vCenter 的信息,并与云中的 Azure Site Recovery 管理服务协调一致。

重新保护服务器: 在重新保护和故障回复操作期间,此组件在 Azure 和本地计算机之间进行协调。

进程服务器:此组件用于在将数据发送到 Azure 之前对其进行缓存和压缩。

详细了解复制设备以及如何使用多个复制设备。

恢复服务代理:此组件用于配置/注册到 Site Recovery 服务,以及监视所有组件的运行状况。

Site Recovery 提供程序: 此组件用于促进重新保护。 它可以识别源计算机的备用位置重新保护和原始位置重新保护。

复制服务: 此组件用于将数据从源位置复制到 Azure。
复制的计算机 出行服务将安装在复制的每个物理服务器上。 建议你允许自动安装移动服务。 或者,你也可以手动安装该服务

设置出站网络连接

若要使 Site Recovery 按预期工作,需修改出站网络连接以允许环境复制。

注意

Site Recovery 不支持使用身份验证代理来控制网络连接。

URL 的出站连接

如果使用基于 URL 的防火墙代理来控制出站连接,请允许访问以下 URL:

URL 详细信息
portal.azure.cn 导航到 Azure 门户。
*.chinacloudapi.cn
*.msftauth.net
*.msauth.net
*.microsoft.com
*.live.com
*.office.com
用于登录到 Azure 订阅。
*.partner.microsoftonline.cn 为设备创建 Microsoft Entra 应用,以便与 Azure Site Recovery 通信。
management.chinacloudapi.cn 为设备创建 Microsoft Entra 应用,以便与 Azure Site Recovery 服务通信。
*.services.visualstudio.com 上传用于内部监视的应用日志。
*.vault.azure.cn 在 Azure Key Vault 中管理机密。 注意:请确保要复制的计算机有权访问它。
aka.ms 允许访问 aka.ms 链接。 适用于 Azure Site Recovery 设备更新。
download.microsoft.com/download 允许从 Microsoft 下载中进行下载。
*.servicebus.chinacloudapi.cn 设备与 Azure Site Recovery 服务之间的通信。
*.discoverysrv.azure.cn 连接 Azure Site Recovery 发现服务 URL。
*.hypervrecoverymanager.azure.cn 连接 Azure Site Recovery 微服务 URL
*.blob.core.chinacloudapi.cn 将数据上传到用于创建目标磁盘的 Azure 存储
*.backup.azure.cn 保护服务 URL - Azure Site Recovery 用于在 Azure 中处理和创建复制磁盘的微服务

复制过程

  1. 启用系统复制时,对 Azure 存储的初始复制将开始(使用指定复制策略)。 注意以下事项:

    • 物理计算机复制是块级的几近不间断行为,使用 VM 上运行出行服务代理。
    • 应用的任何复制策略设置:
      • RPO 阈值。 此设置不影响复制。 它有助于监视。 如果当前 RPO 超出了你指定的阈值限制,则会引发事件,并且还可能会发送电子邮件。
      • 恢复点保留期。 此设置指定当发生中断时要回退的时间距离。 最长保留期为 15 天。
      • 应用一致的快照。 可以每隔 1 到 12 个小时获取一次应用一致的快照,具体取决于应用需求。 快照是标准的 Azure blob 快照。 物理计算机上运行的移动代理在复制流中请求对应此设置的 VSS 快照和作为应用程序一致点的时间点书签。

      注意

      恢复点保持期的值过高可能会影响存储成本,因为可能需要保存更多的恢复点。

  2. 流量通过 Internet 复制到 Azure 存储公共终结点。 或者,可以结合使用 Azure ExpressRoute 和 Microsoft 对等互连。 不支持通过站点到站点虚拟专用网络 (VPN) 将流量从本地站点复制到 Azure。

  3. 初始复制操作可确保在启用复制时将计算机上的所有数据发送到 Azure。 完成初始复制后,开始将增量更改复制到 Azure。 针对机器跟踪的更改将发送到进程服务器。

  4. 通信按如下方式发生:

    • 计算机通过 HTTPS 443 入站端口与本地设备通信,以进行复制管理。
    • 设备通过 HTTPS 443 出站端口与 Azure 协调复制。
    • 计算机通过 HTTPS 9443 入站端口将复制数据发送到进程服务器。 可以修改此端口。
    • 进程服务器接收复制数据、优化和加密数据,然后通过 443 出站端口将其发送到 Azure 存储。
  5. 复制数据首先登陆 Azure 中的缓存存储帐户。 系统将处理这些日志,并将数据存储在 Azure 托管磁盘(称为 asrseeddisk)中。 将在此磁盘上创建恢复点。

故障转移和故障回复过程

在设置复制并运行灾难恢复演练(测试故障转移)以检查是否一切都按预期工作后,可以根据需要继续执行故障转移。

注意

对于物理服务器,不支持故障回复

  1. 可以针对单个计算机运行故障转移,也可以创建一个恢复计划来同时故障转移多个服务器。 相比单计算机故障转移,恢复计划的优势包括:
    • 可以通过在单个恢复计划中包括整个应用的所有服务器,为应用依赖关系建模。
    • 可以添加脚本、Azure Runbook 和暂停手动操作。
  2. 触发初始故障转移之后,可提交它来开始访问 Azure VM 中的工作负荷。

重新同步过程

  1. 有时,在初始复制或传输增量更改期间,源计算机到进程服务器之间或进程服务器到 Azure 之间可能存在网络连接问题。 这两种情况都可能导致暂时无法将数据传输到 Azure。
  2. 为避免出现数据完整性问题,并最大限度地降低数据传输成本,Site Recovery 会标记计算机以进行重新同步。
  3. 在以下情况下也可能标记计算机以进行重新同步,目的是保持源计算机和存储在 Azure 中的数据之间的一致性
    • 如果计算机强制关机
    • 如果计算机出现了诸如磁盘大小调整之类的配置更改(将磁盘大小从 2 TB 修改为 4 TB)
  4. 重新同步仅向 Azure 发送增量数据。 通过计算源计算机和 Azure 中存储的数据之间的数据校验和来最小化本地和 Azure 之间的数据传输。
  5. 默认情况下,重新同步安排为在非工作时间自动运行。 如果不希望等待默认非工作时间的重新同步,可手动重新同步系统。 为此,请转到 Azure 门户,选择物理计算机“>重新同步”。
  6. 如果默认重新同步在办公时间之外失败,并且需要手动干预,则会在 Azure 门户中的特定计算机上生成错误。 可以解决错误并手动触发重新同步。
  7. 重新同步完成后,将继续复制增量更改。

复制策略

启用 Azure VM 复制时,Site Recovery 默认会使用下表中汇总的默认设置创建新的复制策略。

策略设置 详细信息 默认
恢复点保留期 指定 Site Recovery 保留恢复点的时间长短 1 天
应用一致性快照频率 Site Recovery 创建应用一致性快照的频率 已禁用

快照和恢复点

恢复点是基于在特定时间点生成的计算机磁盘快照创建的。 故障转移系统时,可以使用恢复点还原目标位置中的物理计算机作为 VM。

故障转移时,我们通常想要确保 VM 在不发生任何数据损坏或丢失的情况下启动,并且 VM 数据可在操作系统以及 VM 上运行的应用中保持一致。 这取决于创建的快照类型。

Site Recovery 按如下所述创建快照:

  1. 默认情况下,Site Recovery 创建崩溃一致性数据快照;如果指定了频率,则创建应用一致性快照。
  2. 恢复点是基于快照创建的,根据复制策略中的保留期设置进行存储。

一致性

下表解释了不同的一致性类型。

崩溃一致性

说明 详细信息 建议
崩溃一致性快照捕获创建快照时磁盘上的数据。 它不包括内存中的任何数据。

崩溃一致性快照包含在系统发生崩溃或者在创建快照的那一刻从服务器上拔下电源线时,磁盘上的等量数据。

崩溃一致性不能保证操作系统或计算机上的应用中的数据一致性。
默认情况下,Site Recovery 每隔五分钟创建崩溃一致性恢复点。 此设置不可修改。

目前,大多数应用都可以从崩溃一致性恢复点正常恢复。

对于操作系统以及 DHCP 服务器和打印服务器等应用而言,崩溃一致性恢复点通常已足够。

应用一致性

说明 详细信息 建议
应用一致性恢复点是基于应用一致性快照创建的。

应用一致性快照包含崩溃一致性快照中的所有信息,此外加上内存中的数据,以及正在进行的事务中的数据。
应用一致性快照使用卷影复制服务 (VSS):

1) Azure Site Recovery 使用仅复制备份 (VSS_BT_COPY) 方法,该方法不会更改 Microsoft SQL 的事务日志备份时间和序列号

2) 在启动快照时,VSS 会对卷执行写入时复制 (COW) 操作。

3) 执行 COW 之前,VSS 会告知计算机上的每个应用它需要将内存常驻数据刷新到磁盘。

4) 然后,VSS 允许备份/灾难恢复应用(在本例中为 Site Recovery)读取快照数据并继续处理。
应用一致性快照是按指定的频率创建的。 此频率始终应小于为保留恢复点设置的频率。 例如,如果使用默认设置 24 小时保留恢复点,则应将频率设置为小于 24 小时。

应用一致性快照比崩溃一致性快照更复杂,且完成时间更长。

应用一致性快照会影响已启用复制的系统上运行的应用的性能。

后续步骤

按照此教程启用物理计算机和 VMware 到 Azure 的复制。