Compartilhar via

设计和架构具有复原能力的 Azure ExpressRoute

Azure ExpressRoute是一项基本混合连接服务,通常用于本地网络与Azure工作负荷之间的低延迟、复原能力、高吞吐量专用连接。 它提供在本地与Azure之间的网络连接中实现可靠性、复原能力和灾难恢复的能力,以确保业务和任务关键型工作负荷的可用性。 此功能还以可缩放且经济高效的方式扩展对Azure资源的访问权限。

图表说明通过 ExpressRoute 建立本地网络与 Azure 之间的连接。

高度可靠、可复原且可用的网络连接是结构良好的系统的基础。 可靠性由两个原则组成:复原能力和可用性。 复原能力的目标是防止故障,并在发生故障时将应用程序还原到全面运转状态。 可用性的目的是提供对应用程序或工作负载的持续稳定访问。 请务必根据业务需求和应用程序要求主动规划可靠性。

ExpressRoute 用户依赖于边缘站点、WAN 和可用性区域的可用性和性能,以保持其与Azure的连接。 但是,这些组件或站点可能因各种原因(例如设备故障、网络中断、天气状况或自然灾害)而遇到故障。 因此,在规划可靠性、复原能力和可用性时,这是用户与其云提供商之间的共同责任。

ExpressRoute 的站点复原能力

可以使用三种 ExpressRoute 复原体系结构来确保本地和Azure之间的网络连接中的高可用性和复原能力。 这些体系结构设计包括:

“最大复原能力”

ExpressRoute 中的最大复原体系结构的结构旨在消除Azure网络路径中的任何单一故障点。 通过配置两个不同的位置的一对线路来实现此设置,以便使用 ExpressRoute 实现站点多样性。 最大复原能力的目标是提高可靠性、复原能力和可用性,从而确保业务和/或任务关键型工作负载的最高复原能力。 对于此类操作,建议配置最大复原能力。 架构良好的框架是实现可靠性的重要基础,为了实现这种框架,建议采用此体系结构设计。 ExpressRoute 工程团队开发了一个引导式门户体验,来帮助配置最大复原能力。

ExpressRoute 连接的最大复原能力示意图。

高复原能力

高复原能力(也称为 ExpressRoute Metro)允许在同一大都市(Metro)区域中使用多个站点通过 ExpressRoute 将本地网络连接到Azure。 高可复原性通过跨两个站点分割单个电路来提供站点多样化。 第一连接在一个站点建立,第二连接在另一个站点建立。 ExpressRoute Metro 的目标是通过引入可实现站点多样性的功能来缓解边缘站点隔离和故障的影响。 站点多样性是通过在大都市内的配对站点之间使用单个线路来实现的,这将针对边缘和区域之间的故障提供复原能力。 ExpressRoute Metro 提供的站点恢复能力高于标准恢复能力,但不及最大恢复能力。 ExpressRoute Metro 体系结构可用于区域中的业务和任务关键型工作负载。

ExpressRoute 连接的高复原能力示意图。

“标准复原能力”

ExpressRoute 标准复原能力是在单个站点上配置了一条线路和两个连接。 内置的冗余配置以主动-主动模式实现故障转移,以促进在电路的两个连接之间进行切换。 目前,ExpressRoute 在一个对等互联位置提供两个连接。 如果此站点发生故障,则用户可能会遇到与Azure工作负荷的连接丢失。 此配置也称为“单宿”,因为它表示用户采用的是仅配置了一个对等互连位置的 ExpressRoute 线路。 此配置被视为复原能力最低,因此不建议用于业务或任务关键型工作负载,因为它不提供站点复原能力

图中展示了在单个对等互连位置配置了两个链路的单个 ExpressRoute 线路。

ExpressRoute 的区域复原能力

Azure区域是 ExpressRoute 设计和复原策略不可或缺的一部分。 这些区域是托管Azure服务的数据中心的地理位置。 区域通过专用的低延迟网络进行互连,具有高度可用、可容错且可缩放的特点。

Azure提供多种功能来确保区域复原能力。 其中一项功能是可用区。 可用区通过跨区域内的多个物理位置分布,保护应用程序和数据免受数据中心故障的影响。 区域和可用区是应用程序设计和复原策略的核心。 利用可用区,可以在部署中实现更高的可用性和复原能力。 有关详细信息,请参阅区域和可用区

建议将您的 ExpressRoute Virtual Network Gateways 部署为跨同一区域中多个可用性区域的区域冗余。 这些可用区是独立的物理位置,具有独立的基础设施(电源、冷却和网络)。 目的是保护与Azure的本地网络连接免受区域级别故障的影响。 Zone 冗余 ExpressRoute 网关提供复原能力、可伸缩性和更高的可用性,用来访问 Azure 上的关键业务服务。

区域和可用区数据中心中的设备故障或灾难可能会影响虚拟网络中的 ExpressRoute 网关部署。 如果未将网关部署为区域冗余,则Azure数据中心内的此类故障可能会影响用户访问其Azure工作负荷的能力。

如果有现有的非可用区冗余 ExpressRoute 网关,那么现在可以迁移到启用了可用区的网关

建议

以下是可在 ExpressRoute 网络体系结构中确保高可用性、复原和可靠性的建议:

ExpressRoute 线路建议

规划 ExpressRoute 线路或 ExpressRoute Direct

在初始规划阶段,必须要确定是配置 ExpressRoute 线路 还是 ExpressRoute Direct 连接。 ExpressRoute 线路允许通过连接提供商的协助,建立到 Azure 的专用连接。 ExpressRoute Direct 允许在对等互连位置将本地网络直接扩展到 Azure 网络。 另外,还需要确定带宽要求和线路 SKU 类型要求,以满足业务需求。

评估多站点冗余 ExpressRoute 线路的复原能力

部署具有最大复原能力的多站点冗余 ExpressRoute 线路后,必须确保通过冗余线路播发本地路由,以充分利用多站点冗余的优势。 若要评估弹性并进行测试冗余电路和路由的故障切换,请在此了解更多信息。

规划主动-主动配置

为了提高复原能力和可用性,Azure建议在 active-active mode 中运行 ExpressRoute 线路的两个连接。 通过允许两个连接在此模式下运行,Azure按流对连接之间的网络流量进行负载均衡。

物理层多样性

为了提高复原能力,请计划在本地边缘和对等互连位置(提供程序/Microsoft 边缘位置)之间建立多个路径。 这种配置可以通过使用不同的服务提供商,或者通过本地网络路由到其他对等互连节点来实现。 为了实现高可用性,必须在整个端到端网络体系结构中确保 ExpressRoute 线路的冗余。 这包括在本地网络中维持冗余,以及在服务提供商处维持冗余。 确保体系结构的这些部分的冗余意味着不应出现单一故障点。

确保已启用并配置 BFD(双向转发检测)

启用 ExpressRoute 的双向转发检测 (BFD) 可以加速 MSEE 设备与配置 ExpressRoute 线路的路由器之间的链路故障检测。 Azure建议使用 BFD 配置 Customer Premises Edge (CPE) 设备。 ExpressRoute 可以通过你的边缘路由设备或合作伙伴边缘路由设备进行配置。 默认情况下,在Azure端的 MSEE 设备上启用 BFD。

ExpressRoute 网关建议

虚拟网络网关规划

创建 区域冗余Virtual Network网关,以实现更高的复原能力,并计划不同区域中的Virtual Network网关以实现灾难恢复和高可用性。 利用区域冗余网关时,可以从区域复原能力中受益,以便在Azure上访问任务关键型和可缩放的服务。

迁移到区域冗余型 ExpressRoute 网关

引导式网关迁移体验有助于从未启用 Az 的 SKU 网关迁移到启用了 Az 的 SKU 网关。 此功能允许在同一网关子网中创建额外的虚拟网络网关。 在迁移过程中,Azure将控制平面和数据路径配置从现有网关传输到新网关。

灾难恢复和高可用性建议

启用高可用性和灾难恢复

为了最大限度地提高可用性,ExpressRoute 线路上的客户段和服务提供商段均需在构建时确保可用性和复原能力。 对于灾难恢复,请规划好如何应对自然灾害导致的区域服务中断等情况。 为不同区域内配置有不同互联位置的多个电路实施健全的灾难恢复设计。 若要了解详细信息,请参阅:针对灾难恢复进行设计

规划异地冗余

对于灾难恢复规划,我们建议在多个对等互连位置和区域中设置 ExpressRoute 线路。 可以在同一或不同的大都市区中创建 ExpressRoute 线路,通过每个线路的不同路径,可以选择使用不同的服务提供商。 异地冗余 ExpressRoute 线路用于创建可靠的后端网络连接,以便进行灾难恢复。 若要了解详细信息,请参阅针对高可用性进行设计

注意

在处理延迟敏感、任务关键或带宽密集型工作负载时,不建议将站点到站点 VPN 用作 ExpressRoute 连接的备份解决方案。 在这种情况下,建议使用 ExpressRoute 多站点复原功能设计灾难恢复,以确保最大可用性。

通过虚拟网络对等互连实现虚拟网络之间的连接

Virtual Network(VNet)对等互连提供了更高效且直接的方法,使Azure服务无需虚拟网络网关、额外跃点或通过公共互联网传输即可跨虚拟网络进行通信。 若要在虚拟网络之间建立连接,应实现 VNet 对等互连,以获得最佳性能。 有关详细信息,请参阅 虚拟网络对等互连简介管理虚拟网络对等互连

监视和警报建议

为 ExpressRoute 线路配置监视和警报

作为基线,我们建议在 Azure Monitor 内配置 Network Insights,以查看所有 ExpressRoute 线路指标,包括 ExpressRoute Direct 和 Global Reach。 在电路卡片中,您可以可视化对等互连、连接和网关的拓扑结构和依赖关系。 针对线路提供的见解包括可用性、吞吐量和丢包情况。

配置服务运行状况警报,以提供 ExpressRoute 线路维护通知

ExpressRoute 使用 Azure Service Health 通知你计划内和即将进行的 ExpressRoute 线路维护。 使用服务运行状况,可以在 Azure 门户中查看计划和过去的维护,以及配置最适合需求的警报和通知。 在服务运行状况中,可以看到计划内维护和过去的维护。 还可以在服务运行状况中设置警报,以获得有关即将进行的维护的通知。

配置网关运行状况监视和警报

设置监控,使用 Azure Monitor 实现 ExpressRoute 网关的可用性、性能和可伸缩性。 部署 ExpressRoute 网关时,Azure管理网关的计算和功能。 有多个网关指标可用于更好地了解网关的性能。