教程:为 Windows VM 启用灾难恢复

适用于: ✔️ Windows 虚拟机 ✔️ 灵活规模集

本教程介绍如何为运行Windows Azure VM 设置灾难恢复。 在本文中,将学习以下内容:

  • 为Windows VM 启用灾难恢复
  • 运行灾难恢复演练,检查它是否按预期工作
  • 进行演练后停止复制 VM

为 VM 启用复制时,Site Recovery 移动服务扩展会安装到 VM 上,并在 Azure Site Recovery 中注册。 在复制过程中,系统会将 VM 磁盘写入发送到源区域中的缓存存储帐户。 数据从那里发送到目标区域,并根据数据生成恢复点。 在灾难恢复过程中对 VM 进行故障转移时,将使用恢复点在目标区域创建 VM。

如果没有 Azure 订阅,请在开始前创建 试用订阅

先决条件

  1. 检查Azure订阅是否允许在目标区域中创建 VM。 如果刚刚创建了Azure帐户,则你是订阅的管理员,并且你拥有所需的权限。

  2. 如果你不是订阅管理员,请联系管理员为你分配:

    • 虚拟机参与者内置角色或特定权限,用于:
      • 在所选虚拟网络中创建 VM。
      • 写入Azure存储帐户。
      • 写入Azure托管磁盘。
    • Site Recovery 贡献者内置角色,用于管理保管库中的 Site Recovery 操作。
  3. 建议使用运行Windows Server 2012或更高版本的 Windows VM。 对于本教程,不应加密 VM 磁盘。

  4. 如果 VM 出站连接使用基于 URL 的代理,请确保其可以访问这些 URL。 不支持使用经过身份验证的代理。

    Name 由世纪互联云运营的 Microsoft Azure 详细信息
    存储 *.blob.core.chinacloudapi.cn 将数据从 VM 写入源区域中的缓存存储帐户。
    Microsoft Entra ID login.chinacloudapi.cn 授权和验证 Site Recovery 服务的 URL。
    复制 *.hypervrecoverymanager.windowsazure.cn 虚拟机与 Site Recovery 服务的通信。
    服务总线 *.servicebus.chinacloudapi.cn VM 写入站点恢复监视和诊断数据。
  5. 如果使用网络安全组 (NSG) 限制 VM 的网络流量,请创建相关 NSG 规则,允许使用这些服务标记(IP 地址组)为 VM 进行出站连接 (HTTPS 443)。 首先在测试 NSG 上尝试规则。

    标记 允许
    存储标记 允许将数据从 VM 写入缓存存储帐户。
    Microsoft Entra ID标签 允许访问与Microsoft Entra ID对应的所有 IP 地址。
    EventsHub 标记 允许访问 Site Recovery 监控。
    AzureSiteRecovery 标记 允许在任何区域中访问Site Recovery服务。
    访客与混合管理 如果您想自动升级在启用复制功能的 VM 上运行的站点恢复移动代理,请使用此功能。
  6. 在Windows VM 上,安装最新的Windows更新,以确保 VM 具有最新的根证书。

创建 VM 并启用灾难恢复

创建 VM 时,你可以选择启用灾难恢复。

  1. 创建 VM

  2. 在“管理”选项卡上,选择“启用灾难恢复”。

  3. 在“次要区域”中,选择要在其中复制 VM 以进行灾难恢复的目标区域。

  4. 在“次要订阅”中,选择要用于创建目标 VM 的目标订阅。 将源 VM 从源区域故障转移到目标区域时,系统即会创建目标 VM。

  5. 在“恢复服务保管库”中,选择要用于复制的保管库。 如果没有保管库,请选择“新建”。 选择要在其中存放保管库的资源组和保管库名称。

  6. Site Recovery 策略中,保留默认策略,或选择 新建设置自定义值。

    • 恢复点是基于在特定时间点生成的 VM 磁盘快照创建的。 故障转移 VM 时,你可以使用恢复点来还原目标区域中的 VM。
    • 每 5 分钟创建一次崩溃一致的恢复点。 此设置不可修改。 创建崩溃一致性快照时捕获的内容是磁盘上当时的数据。 它不包括内存中的任何数据。
    • 默认情况下,Site Recovery将崩溃一致的恢复点保留 24 小时。 你可以设置一个介 于0 到 72 小时之间的自定义值。
    • 系统每 4 小时拍摄一次应用程序一致快照。 应用程序一致的快照
    • 默认情况下,Site Recovery存储恢复点 24 小时。
  7. 在“可用性选项”中,指定 VM 是作为独立部署、在可用性区域中部署还是在可用性集中部署。

    在 VM 管理属性页启用复制。

  8. 完成 VM 创建。

注意

在创建Windows VM 时启用复制时,只会复制 OS 磁盘。 需要由你初始化数据磁盘,之后Azure Site Recovery会自动复制它们。

为现有的 VM 启用灾难恢复

如果要在现有 VM 而不是新 VM 上启用灾难恢复,请使用此步骤流程。

  1. 在Azure门户中,打开 VM 属性页。

  2. 在“操作”中,选择“灾难恢复” 。

    打开现有 VM 的灾难恢复选项。

  3. 在“基础知识”中,如果 VM 部署在可用性区域中,则可以选择两个可用性区域之间的灾难恢复。

  4. 在“目标区域”中,选择要将 VM 复制到其中的区域。 源和目标区域必须位于同一Microsoft Entra租户中。

    为 VM 设置基本灾难恢复选项。

  5. 选择“下一步:高级设置”。

  6. 在“高级设置”中,你可以查看设置,并修改自定义设置的值。 默认情况下,Site Recovery镜像源设置以创建目标资源。

    • 目标订阅。 故障转移后用于创建目标 VM 的订阅。
    • 目标 VM 资源组。 故障转移后在其中创建目标 VM 的资源组。
    • 目标虚拟网络。 Azure在故障转移后创建目标 VM 时所在的虚拟网络。
    • 目标可用性。 在作为单一实例、可用性集或可用性区域中创建目标 VM 时。
    • 邻近放置。 如果适用,请在故障转移后选择目标 VM 所在的邻近放置组。
    • 存储设置 - 缓存存储帐户。 恢复使用源区域中的存储帐户作为临时数据存储。 在将“源 VM 更改”复制到目标位置之前,会将其缓存在此帐户中。
      • 默认情况下,系统将为每个保管库创建一个缓存存储帐户,并可重复使用。
      • 如果要为 VM 自定义缓存帐户,你可以选择不同的存储帐户。
    • 存储设置 - 副本托管磁盘。 默认情况下,Site Recovery在目标区域中创建副本托管磁盘。
      • 默认情况下,目标托管磁盘使用相同的存储类型(标准 HDD/SSD 或高级 SSD)镜像源 VM 托管磁盘。
      • 你可以根据需要自定义存储类型。
    • 复制设置。 显示 VM 所在的保管库,以及用于 VM 的复制策略。 默认情况下,Site Recovery 为 VM 创建的恢复点将保留 24 小时。
    • 扩展设置。 表明 Site Recovery 负责管理安装在您复制的虚拟机上的 Site Recovery 移动服务扩展的更新。
      • 指定的 Azure 自动化帐户管理更新过程。
      • 你可以自定义自动化帐户。

    页面显示目标和复制设置的摘要。

  7. 选择“查看 + 开始复制”

  8. 选择“启动复制”。 部署开始,Site Recovery开始创建目标资源。 可以在通知中监视复制进度。

    复制进度通知。

检查 VM 状态

复制作业完成后,可以检查 VM 复制状态。

  1. 打开 VM 属性页。

  2. 在“操作”中,选择“灾难恢复” 。

  3. 展开“基本信息”部分,查看保管库、复制策略和目标设置的默认值。

  4. 在“运行状况和状态”中,获取有关 VM 的复制状态、代理版本、故障转移准备情况以及最新恢复点的信息。

    VM 灾难恢复的“概要”视图。

  5. 在“基础结构视图”中,获取源和目标 VM、托管磁盘和缓存存储帐户的直观概述。

    VM 灾难恢复的基础设施可视化地图。

运行演练

运行演练,确保灾难恢复按预期方式进行。 当您运行测试故障转移时,它将创建 VM 的副本,但不会影响正在进行的复制过程或生产环境。

  1. 在 VM 灾难恢复页面中,选择“测试故障转移”。

  2. 在“测试故障转移”中,保留恢复点的默认“最新处理(低 RPO)”设置 。

    此选项提供最低的恢复点目标 (RPO),并且通常提供目标 VM 的最快启动速度。 它首先处理已发送到Site Recovery服务的所有数据,以便在故障转移到它之前为每个VM创建恢复点。 此恢复点在触发故障转移时已将所有数据复制到站点恢复服务。

  3. 选择故障转移后 VM 所处的虚拟网络。

    设置测试故障转移选项的页面。

  4. 测试故障转移过程开始。 可在通知中监视进度。

    测试故障转移通知。

    测试故障转移完成后,虚拟机在“Essentials”页面上处于“清理测试故障转移挂起”状态。

清理资源

演练后Site Recovery自动清理 VM。

  1. 若要开始自动清理,请选择“清理测试故障转移”。

    在“概要”页上启动清理。

  2. 测试故障转移清理中,输入您想为故障转移记录的所有备注,然后选择“测试已完成,删除测试故障转移虚拟机”。 然后选择“确定” 。

    用于记录说明并删除测试 VM 的页面。

  3. 删除过程开始。 可在通知中监视进度。

    用于监控删除测试 VM 的通知。

停止复制 VM

完成灾难恢复演练后,建议继续测试一下完整的故障切换。 如果不想执行完整的故障转移,则可以禁用复制。 这样会执行以下操作:

  • 从 Site Recovery 的复制计算机列表中删除虚拟机。
  • 停止对 VM 的 Site Recovery 计费。
  • 自动清理源复制设置。

请按如下所述停止复制:

  1. 在“VM 灾难恢复”页面中,选择“禁用复制”。

  2. 在“禁用复制”中,选择要禁用复制的原因。 然后选择“确定” 。

    可禁用复制并提供原因的页面。

复制期间 VM 上安装的Site Recovery扩展不会自动删除。 如果禁用 VM 的复制,并且以后不想再次复制它,则可以手动删除Site Recovery扩展,如下所示:

  1. 转到 VM>“设置”,“扩展”>。

  2. Extensions 页面中,选择每个适用于 Linux 的 Microsoft.Azure.RecoveryServices 条目。

  3. 在扩展的属性页中,选择“卸载”。

    卸载 Site Recovery VM 扩展的页面。

后续步骤

在本教程中,为Azure VM 配置了灾难恢复,并运行了灾难恢复演练。 现在,可以对 VM 执行完整的故障转移了。