在发生灾难性数据丢失后进行恢复

适用于:Azure Stack 集成系统。

Azure Stack 在数据中心内运行 Azure 服务。 运行 Azure Stack 的环境可以小至包含安装在单个机架中的四个节点。 同时,Azure 也可以在 40 多个地区中的多个数据中心内运行,并且每个地区中可以有多个区域。 用户资源可以跨多个服务器、机架、数据中心和地区。 使用 Azure Stack,当前只能将整个云部署到单个机架。 这会导致你的云有在数据中心内发生灾难性事件的风险,以及由于重大产品 bug 而发生故障的风险。 当灾难发生时,Azure Stack 实例会进入脱机状态。 可能无法恢复所有数据。

根据数据丢失的根本原因,你可能需要修复单个基础结构服务或还原整个 Azure Stack 实例。 你甚至可能需要还原到同一位置或其他位置中的其他硬件。

此方案用于应对在设备发生故障的情况下恢复整个安装以及重新部署私有云。

方案 数据丢失 注意事项
在由于灾难或产品 bug 而发生灾难性数据丢失后进行恢复 所有基础结构及用户和应用数据 用户应用程序和数据是独立于基础结构数据进行保护的

工作流

保护 Azure Stack 的过程从分别备份基础结构和应用/租户数据开始。 本文档介绍了如何保护基础结构。

Azure Stack 的初始部署

在所有数据均丢失的最差情形方案中,恢复 Azure Stack 是还原与 Azure Stack 部署相关的基础结构数据和所有用户数据的过程。

重新部署 Azure Stack

还原

如果发生灾难性数据丢失,但硬件仍然可以使用,则需要重新部署 Azure Stack。 在重新部署期间,可以指定存储位置和访问备份所需的凭据。 在此模式下,不需要指定需要还原的服务。 基础结构备份控制器将控制层状态插入为部署工作流的一部分。

如果发生导致硬件不可用的灾难,则只能在新硬件上重新部署。 因为要订购更换硬件并等待硬件到达数据中心,所以重新部署可能会花费数周时间。 可以在任何时间还原控制层数据。 但是,如果重新部署的实例的版本比上次备份中使用的版本高一个版本,则不支持还原。

部署模式 起点 终点
全新安装 基线版本 OEM 部署 Azure Stack,并更新到最新的受支持版本。
恢复模式 基线版本 OEM 在恢复模式下部署 Azure Stack 并根据可用的最新备份来处理版本匹配要求。 OEM 通过更新到最新的受支持版本来完成部署。

备份中的数据

Azure Stack 支持称为云恢复模式的部署类型。 只有当灾难或产品 bug 导致解决方案不可恢复后,你选择恢复 Azure Stack 时才使用此模式。 此部署模式不会恢复解决方案中存储的任何用户数据。 此部署模式的作用域仅限于还原以下数据:

  • 部署输入
  • 内部标识系统
  • 联合标识配置(断开连接部署)
  • 内部证书颁发机构使用的根证书
  • Azure 资源管理器配置用户数据,例如订阅、计划、产品/服务,以及存储、网络和计算资源的配额
  • KeyVault 机密和保管库
  • RBAC 策略分配和角色分配

在部署期间不会恢复任何用户基础结构即服务 (IaaS) 或平台即服务 (PaaS) 资源。 也就是说,IaaS VM、存储帐户、blob、表、网络配置等等都会丢失。 云恢复的目的是为了确保操作员和用户在部署完成后可以重新登录回门户。 重新登录回来的用户不会看到其任何资源。 用户将还原其订阅以及由管理员定义的原始计划和产品/服务策略。 重新登录回系统的用户在操作时将受原始解决方案在发生灾难前施加的相同约束制约。 在云恢复完成后,操作员可以手动还原增值 RP 和第三方 RP 以及关联的数据。

后续步骤