延伸群集概述

适用于:Azure Stack HCI 版本 22H2 和 21H2

用于灾难恢复的 Azure Stack HCI 延伸群集解决方案提供自动故障转移以快速恢复生产,而无需手动干预。 存储副本提供跨站点的卷复制以进行灾难恢复,所有服务器保持同步。

存储副本支持同步和异步复制:

  • 同步复制使用在故障时保持一致的卷在低延迟网络中跨站点创建数据镜像,以确保在发生故障时不会在文件系统级别上丢失任何数据。
  • 异步复制通过具有较高延迟的网络链接映射都市范围外的站点之间的数据,但不保证在出现故障时两个站点具有完全相同的数据副本。 如果复制在失败之前完成,则目标卷会在故障转移后自动联机。 如果复制在发生故障时正在进行,则必须手动使目标卷联机。

有两种类型的延伸群集:主动-被动和主动-主动。 可设置主动-被动站点复制,其中有一个首选站点和复制方向。 主动-主动复制是指可从任一站点进行双向复制。 本文仅介绍主动/被动配置。

简单地说,主动站点具有资源并为客户端提供要连接的角色和工作负载。 被动站点不为客户端提供任何角色或工作负载,并且将等待来自主动站点的故障转移以进行灾难恢复。

这两个站点可位于两个不同的州、不同的城市、不同的楼层或不同的房间。 如果站点出现停机或故障,使用两个站点的延伸群集可提供灾难恢复和业务连续性。

主动-被动延伸群集

下图显示站点 1 是主动站点,复制到站点 2(单向复制)。

主动/被动拉伸群集方案。

主动-主动延伸群集

下图显示站点 1 和站点 2 均是主动站点,双向复制到其他站点。

主动/主动延伸群集方案

来宾 IP 故障转移注意事项

讨论拉伸群集时,必须要考虑的一个事项是所使用的虚拟机和 IP 地址。 位于不同位置的数据中心通常具有不同的 IP 子网。 虚拟机使用的 IP 地址适用于一个数据中心,但在另一个数据中心可能无法访问。 因此,计划如何处理 IP 地址更改是一个必须要考虑的事项。 大多数情况下,有四种不同的方法可以处理故障转移时虚拟机上的 IP 地址更改。 可能有其他方法,但本文档将介绍最常用的四个方法。

第一个也是最简单的方法是使用 DHCP。 将虚拟机从一个站点移动到另一个站点时,它将执行的一个步骤是请求 DHCP 地址。 只要 DHCP 服务器可用,此操作就会获取虚拟机所在的正确站点的正确 IP 地址。

第二个方法是使用静态地址。 但是,与 Hyper-V 副本不同,无法指定备用 IP 地址。 因此,需要创建一个脚本,根据 VM 所处的站点为 VM 分配正确的 IP 地址。 例如,SiteA 使用 1.x 网络,SiteB 使用 156.x 网络。 此脚本需要检测虚拟机所在的网络,如果它在 SiteA 中,则设置 1.x IP 地址方案,如果在 SiteB 中,则设置 156.x IP 地址方案。 还需要通过警报让域名服务 (DNS) 了解站点之间的更改和复制。

第三个方法是使用中间网络设备,该设备将为虚拟机提供单个 IP 地址以用于客户端连接,该连接可将虚拟机的流量路由到其当前所在站点。 客户端和 DNS 将始终具有相同的虚拟机地址,中间设备需要跟踪虚拟机的实际 IP 地址和位置,以便将客户端正确定向到虚拟机。

最后一个方法是使用拉伸 vLAN。 使用拉伸 vLAN 时,无论虚拟机位于什么站点,都可以保留相同的 IP 地址。 但是,由于配置和维护拉伸 vLAN 的一些复杂性,Azure 不建议使用此方法。

使用上述任一方法时,当涉及到客户端连接时,需要考虑其他注意事项(DNS、ARP 缓存、TTL 等),并且必须仔细考虑。请与网络团队合作,确定满足需求的最佳选项。

后续步骤