Azure 映像生成器 (AIB) 中的可靠性

本文包含映像生成器跨区域灾难恢复和业务连续性的特定可靠性建议。

Azure 映像生成器 (AIB) 是一种区域性服务,具有为单个区域提供服务的群集。 AIB 地区设置会将数据和资源保留在地区边界内。 作为一种服务,AIB 不会在地区停机的情况下为集群和 SQL 数据库进行故障转移。

有关 Azure 可靠性的体系结构概述,请参阅《Azure 可靠性》。

注意

Azure 映像生成器不支持可用性区域

可靠性建议

本部分包含针对实现复原能力和可用性的建议。 每个建议可归入以下两个类别之一:

  • 运行状况项涵盖配置项目和构成 Azure 工作负载的主要组件的正确功能等方面,例如 Azure 资源配置设置、对其他服务的依赖项等。

  • 风险项涵盖可用性和恢复要求、测试、监视、部署和其他项目(如果未解决,则会增加环境中出现问题的可能性)等方面。

可靠性建议优先级矩阵

每项建议都根据以下优先级矩阵进行标记:

映像 优先级 说明
需要立即修复。
在 3-6 个月内修复。
需要审查。

可靠性建议摘要

类别 优先级 建议
高可用性 使用第 2 代虚拟机源映像
灾难恢复 将映像模板复制到次要区域

高可用性

使用第 2 代虚拟机 (VM) 源映像

生成映像模板时,请使用支持第 2 代 VM 的源映像。 第 2 代 VM 支持第 1 代 VM 不支持的关键特性,例如:

  • 增加的内存

  • 支持大于 2TB 的磁盘

  • 相反,基于 UEFI 的新启动体系结构可以缩短启动和安装时间

  • 虚拟化永久性内存 (vPMEM)

有关第 2 代 VM 特性和功能的详细信息,请参阅第 2 代 VM:特性和功能

灾难恢复

将映像模板复制到次要区域

用于部署映像模板的 Azure 映像生成器服务当前不支持可用性区域。 因此,生成映像模板时,应将它们复制到次要区域,最好复制到主要区域的配对区域。 使用次要区域,可以从区域故障中快速恢复,并继续从映像模板部署虚拟机。 有关详细信息,请参阅跨区域灾难恢复和业务连续性

// Azure Resource Graph Query
// List all Image Templates that are not replicated to another region
resources
| where type =~ "microsoft.virtualmachineimages/imagetemplates"
| mv-expand distribution=properties.distribute
| where array_length(parse_json(distribution).replicationRegions) == 1
| project recommendationId = "it-2", name, id, param1=strcat("replicationRegions:",parse_json(distribution).replicationRegions)

跨区域灾难恢复和业务连续性

灾难恢复 (DR) 是指从会导致故障时间和数据丢失的高影响事件(例如自然灾害或部署失败)中恢复。 不管灾难的原因是什么,最好的补救措施就是一个定义全面且经过测试的 DR 计划,以及一个主动支持 DR 的应用程序设计。 在开始考虑创建灾难恢复计划之前,请参阅设计灾难恢复策略的建议

在 DR 方面,Azure 使用共同责任模型。 在共担责任模型中,Azure 会确保基线基础结构和平台服务可用。 同时,许多 Azure 服务不会自动复制数据,也不会从失败区域回退以交叉复制到另一个启用的区域。 对于这些服务,你负责设置适用于工作负载的灾难恢复计划。 大多数在 Azure 平台即服务 (PaaS) 产品/服务上运行的服务都提供支持 DR 的功能和指导,你可以使用特定于服务的功能来支持快速恢复,从而帮助制定 DR 计划。

为了确保 Azure 映像生成器 (AIB) 快速轻松地完成恢复,建议在设计 AIB 解决方案时在区域对或多个区域中运行映像模板。 设置映像模板时,还应从一开始就复制资源。

多区域地理位置灾难恢复

发生区域性灾难时,Azure 负责中断检测、通知和 AIB 支持。 但是,你负责为控制(服务端)和数据平面设置灾难恢复。

服务中断检测、通知和管理

如果 Azure 映像生成器 (AIB) 服务发生中断,Azure 将发送通知。 一个常见的中断症状是,映像模板在尝试运行时出现 500 错误。 可以通过支持请求查看 Azure 映像生成器中断通知和状态更新。

设置灾难恢复和中断检测

你负责为你的 Azure 映像生成器 (AIB) 环境设置灾难恢复,因为 AIB 服务端没有区域故障转移。 需要配置控制平面(服务端)和数据平面。

建议在附近的另一个区域中创建一个 AIB 资源,可在其中复制资源。 有关详细信息,请参阅支持的区域以及创建 AIB 时所包含的资源。

单一区域地理位置灾难恢复

对于单区域的灾难,你仍需要从该区域获取映像模板资源,即使该区域不可用。 你可以在本地维护映像模板的副本,也可以使用 Azure 门户中的 Azure Resource Graph 来获取映像模板资源。

要使用 Azure 门户中的 Resource Graph 来获取映像模板资源:

  1. 转到 Azure 门户中的搜索栏,然后搜索“Resource Graph 资源管理器”。

    该屏幕截图显示了门户中的 Azure Resource Graph 资源管理器。

  2. 使用最左侧的搜索栏按类型和名称搜索资源,看看详细信息部分如何显示映像模板的属性。 右下角的“查看详细信息”选项会分别显示映像模板的属性和标记。 模板名称、位置、ID 和租户 ID 可用于获取正确的映像模板资源。

    使用 Azure Resource Graph 资源管理器搜索的屏幕截图。

容量和主动灾难恢复复原能力

Azure 及其客户按共担责任模型运营。 在客户支持的 DR(客户负责的服务)中,你负责解决你部署和控制的任何服务的 DR。 要确保恢复是主动的,应始终预先部署辅助数据库。 如果没有预先部署的辅助数据库,则无法保证受影响时的容量。

在规划模板复制位置时,请考虑:

  • AIB 区域可用性:
    • 选择靠近用户的 AIB 支持地区
    • AIB 将不断向新的地区扩展。
  • Azure 配对区域:
    • 对于地理区域,请选择两个相互配对的区域。
    • 需要优先处理的配对地区恢复工作。

其他指南

有关你的数据处理信息,请参阅 Azure 映像生成器的数据驻留详细信息。

后续步骤