教程:为 Linux 虚拟机设置灾难恢复

适用于:✔️ Linux VM ✔️ 灵活规模集

本教程介绍如何为运行 Linux 的 Azure VM 设置灾难恢复。 在本文中,将学习以下内容:

  • 为 Linux VM 启用灾难恢复
  • 运行灾难恢复演练,检查它是否按预期工作
  • 进行演练后停止复制 VM

为 VM 启用复制时,Site Recovery 移动服务扩展将安装在 VM 上,并将其注册到 Azure Site Recovery。 在复制过程中,系统会将 VM 磁盘写入发送到源 VM 区域中的缓存存储帐户。 数据从那里发送到目标区域,并根据数据生成恢复点。 在灾难恢复过程中将 VM 故障转移到其他区域时,使用恢复点在目标区域中创建 VM。

如果没有Azure订阅,请在开始前创建 Trial

先决条件

  1. 检查Azure订阅是否允许在目标区域中创建 VM。 如果刚刚创建了Azure帐户,则你是订阅的管理员,并且你拥有所需的权限。

  2. 如果你不是订阅管理员,请联系管理员为你分配:

    • 虚拟机参与者内置角色或特定权限,用于:
      • 在所选虚拟网络中创建 VM。
      • 写入Azure存储帐户。
      • 写入Azure托管磁盘。
    • Site Recovery 参与者内置角色,用于管理保管库中的 Site Recovery 操作。
  3. 检查 Linux VM 是否正在运行支持的操作系统

  4. 如果 VM 出站连接使用基于 URL 的代理,请确保其可以访问这些 URL。 不支持使用经过身份验证的代理。

    Name 中国云 详细信息
    存储 *.blob.core.chinacloudapi.cn 将数据从 VM 写入源区域中的缓存存储帐户。
    Microsoft Entra ID login.partner.microsoftonline.cn 授权并进行身份验证到 Site Recovery 服务的 URL。
    复制 *.hypervrecoverymanager.windowsazure.cn VM 与 Site Recovery 服务的通信。
    服务总线 *.servicebus.chinacloudapi.cn VM 写入Site Recovery以监视和诊断数据。
  5. 如果使用网络安全组 (NSG) 限制 VM 的网络流量,请创建相关 NSG 规则,允许使用这些服务标记(IP 地址组)为 VM 进行出站连接 (HTTPS 443)。 首先在测试 NSG 上尝试规则。

    标记 允许
    存储标记 允许将数据从 VM 写入缓存存储帐户。
    Microsoft Entra ID 标记 允许访问与Microsoft Entra ID对应的所有 IP 地址。
    事件枢纽标签 允许访问 Site Recovery 监控。
    Azure Site Recovery 标记 允许在任何区域中访问Site Recovery服务。
    访客与混合管理 如果要自动升级在启用了复制的 VM 上运行的Site Recovery移动代理,请使用该代理。
  6. 确保 VM 具有最新的根证书。 在 Linux VM 上,请遵循 Linux 分销商提供的指导,在 VM 上获取最新的受信任根证书和证书吊销列表。

创建 VM 并启用灾难恢复

创建 VM 时,你可以选择启用灾难恢复。

  1. 创建 Linux VM

  2. Management 选项卡上,在 Site Recovery 下选择 启用灾难恢复

  3. 在“次要区域”中,选择要在其中复制 VM 以进行灾难恢复的目标区域。

  4. 在“辅助订阅”中,选择创建目标 VM 所需的目标订阅。 将源 VM 从源区域故障转移到目标区域时,系统即会创建目标 VM。

  5. 在“恢复服务保管库”中,选择要用于复制的保管库。 如果没有保管库,请选择“新建”。 选择要在其中存放保管库的资源组和保管库名称。

  6. Site Recovery 策略中,保留默认策略,或选择 新建设置自定义值。

    • 恢复点是基于在特定时间点生成的 VM 磁盘快照创建的。 在执行虚拟机故障转移时,你可以使用恢复点来还原目标区域中的虚拟机。
    • 每 5 分钟创建一次崩溃一致性的恢复点。 此设置不可修改。 崩溃一致性快照会捕获创建快照时磁盘上的数据。 它不包括内存中的任何数据。
    • 默认情况下,Site Recovery将崩溃一致的恢复点保留 24 小时。 你可以设置一个介 于0 到 72 小时之间的自定义值。
    • 系统每 4 小时拍摄一次应用程序一致快照。
    • 默认情况下,Site Recovery存储恢复点 24 小时。
  7. 在“可用性选项”中,指定 VM 是作为独立部署、在可用性区域中部署还是在可用性集中部署。

    在 VM 管理属性页启用复制。

  8. 完成 VM 创建。

为现有的 VM 启用灾难恢复

如果要在现有 VM 上启用灾难恢复,请使用此程序。

  1. 在Azure门户中,打开 VM 属性页。

  2. 在“操作”中,选择“灾难恢复” 。

    打开现有 VM 的灾难恢复选项。

  3. 在“基础知识”中,如果 VM 部署在可用性区域中,则可以选择两个可用性区域之间的灾难恢复。

  4. 在“目标区域”中,选择要将 VM 复制到其中的区域。 源和目标区域必须位于同一Microsoft Entra租户中。

    为 VM 设置基本灾难恢复选项。

  5. 选择下一步:高级设置

  6. 在“高级设置”中,你可以查看设置,并修改自定义设置的值。 默认情况下,Site Recovery镜像源设置以创建目标资源。

    • 目标订阅。 故障转移后用于创建目标 VM 的订阅。
    • 目标 VM 资源组。 故障转移后在其中创建目标 VM 的资源组。
    • 目标虚拟网络。 故障转移后创建目标 VM 时所在的 Azure 虚拟网络。
    • 目标可用性。 当目标虚拟机作为单一实例,在可用性集或可用性区域中创建时。
    • 邻近放置。 如果适用,请在故障转移后选择目标 VM 所在的邻近放置组。
    • 存储设置 - 缓存存储帐户。 恢复使用源区域中的存储帐户作为临时数据存储。 在将“源 VM 更改”复制到目标位置之前,会将其缓存在此帐户中。
      • 默认情况下,系统将为每个保管库创建一个缓存存储帐户,并可重复使用。
      • 如果要为 VM 自定义缓存帐户,你可以选择不同的存储帐户。
    • 存储设置 - 副本托管磁盘。 默认情况下,Site Recovery在目标区域中创建副本托管磁盘。
      • 默认情况下,目标托管磁盘使用相同的存储类型(标准 HDD/SSD 或高级 SSD)镜像源 VM 托管磁盘。
      • 你可以根据需要自定义存储类型。
    • 复制设置。 显示 VM 所在的保管库,以及用于 VM 的复制策略。 默认情况下,Site Recovery 为 VM 创建的恢复点将保留 24 小时。
    • 扩展设置。 说明 Site Recovery 管理您复制的虚拟机上安装的 Site Recovery 移动服务扩展的更新。
      • 所指的 Azure Automation 帐户负责管理更新过程。
      • 你可以自定义自动化帐户。

    页面显示目标和复制设置的摘要。

  7. 选择“查看 + 开始复制”

  8. 选择“启动复制”。 部署开始,Site Recovery开始创建目标资源。 可以在通知中监视复制进度。

    复制进度通知。

检查 VM 状态

复制作业完成后,可以检查 VM 复制状态。

  1. 打开 VM 属性页。

  2. 在“操作”中,选择“灾难恢复” 。

  3. 展开“基本信息”部分,查看保管库、复制策略和目标设置的默认值。

  4. 在“运行状况和状态”中,获取有关 VM 的复制状态、代理版本、故障转移准备情况以及最新恢复点的信息。

    VM 灾难恢复的“概要”视图。

  5. 在“基础结构视图”中,获取源和目标 VM、托管磁盘和缓存存储帐户的直观概述。

    VM 灾难恢复的基础设施可视化地图。

运行演练

运行演练,确保灾难恢复按预期方式进行。 当您运行测试故障转移时,它将创建 VM 的副本,但不会影响正在进行的复制过程或生产环境。

  1. 在 VM 灾难恢复页面中,选择“测试故障转移”。

  2. 在“测试故障转移”中,保留恢复点的默认“最新处理(低 RPO)”设置 。

    此选项提供最低的恢复点目标 (RPO),通常可以在目标区域中最快地启动 VM。 它首先处理已发送到Site Recovery服务的所有数据,以便在故障转移之前为每个 VM 创建恢复点。 此恢复点包含故障转移被触发时复制到 Site Recovery 的所有数据。

  3. 选择故障转移后 VM 所处的虚拟网络。

    设置测试故障转移选项的页面。

  4. 测试故障转移过程开始。 可在通知中监视进度。

    测试故障转移通知。

    测试故障转移完成后,虚拟机在“Essentials”页面上处于“清理测试故障转移挂起”状态。

清理资源

演练后Site Recovery自动清理 VM。

  1. 若要开始自动清理,请选择“清理测试故障转移”。

    在“概要”页上启动清理。

  2. 测试故障转移清理中,输入您想为故障转移记录的所有备注,然后选择“测试已完成,删除测试故障转移虚拟机”。 然后选择“确定” 。

    用于记录说明并删除测试 VM 的页面。

  3. 删除过程开始。 可在通知中监视进度。

    用于监控删除测试 VM 的通知。

停止复制 VM

完成灾难恢复演练后,建议继续测试一下完整的故障切换。 如果不想执行完整的故障转移,则可以禁用复制。 禁用复制会:

  • 从 Site Recovery 的复制计算机列表中删除 VM。
  • 停止对 VM 的 Site Recovery 计费。
  • 自动清理源复制设置。

请按如下所述停止复制:

  1. 在“VM 灾难恢复”页面中,选择“禁用复制”。

  2. 在“禁用复制”中,选择要禁用复制的原因。 然后选择“确定” 。

    可禁用复制并提供原因的页面。

复制期间 VM 上安装的Site Recovery扩展不会自动删除。 如果禁用 VM 的复制,并且以后不想再次复制它,则可以手动删除Site Recovery扩展,如下所示:

  1. 转到 VM>“设置”,“扩展”>。
  2. Extensions 页中,选择每个适用于 Linux 的 Microsoft.Azure.RecoveryServices 条目。
  3. 在扩展的属性页中,选择“卸载”。

后续步骤

在本教程中,为Azure VM 配置了灾难恢复,并运行了灾难恢复演练。 现在,可以对 VM 执行完整的故障转移了。