Compartir a través de

执行灾难恢复演练 - Azure SQL 托管实例

适用于:Azure SQL 托管实例

建议定期测试和验证应用程序是否已准备好进入恢复工作流。 验证应用程序的行为以及数据丢失和/或涉及到故障转移的中断所造成的影响,是一种良好的工程实践。 许多行业标准在涉及到业务连续性认证方面也会提出此要求。

执行灾难恢复演练的操作包括:

  • 模拟数据层中断
  • 恢复
  • 验证恢复后的应用程序完整性

根据针对业务连续性设计应用程序的方式,用于执行演练的工作流会有所不同。 本文介绍在 Azure SQL 托管实例上下文中执行灾难恢复演练的最佳做法。

异地还原

若要防止执行灾难恢复演练时发生潜在的数据丢失,请通过创建生产环境的副本在测试环境中执行演练,并使用测试环境来验证应用程序的故障转移工作流。

中断模拟

若要模拟中断,可重命名源数据库。 此名称更改会导致应用程序连接失败。

恢复

验证

通过验证恢复后的应用程序完整性(包括连接字符串、登录名、基本功能测试,或标准应用程序验收过程的其他验证部分)来完成演练。

故障转移组

对于故障转移组保护的实例,演练过程包括按计划故障转移到辅助实例。 计划的故障转移可确保在切换角色后故障转移组中的主实例和辅助实例保持同步。 与非计划的故障转移不同,此操作不会导致数据丢失,因此可以在生产环境中执行演练。

使用符合业务需求的故障转移策略配置故障转移组,并测试故障转移,而不必考虑故障转移策略是如何配置的。 有关详细信息,请参阅测试故障转移。 建议使用客户管理的故障转移策略来控制故障转移过程。

重要

由于系统数据库不会在故障转移组中的实例之间复制,因此请在辅助实例上手动重新创建系统对象,然后使用系统对象依赖关系对环境进行测试,以确保它们在故障转移后继续正常运行。

中断模拟

若要模拟中断,可以禁用已连接到数据库的 Web 应用程序或虚拟机。 此中断模拟会导致 Web 客户端连接失败。

恢复

  • 确保 DR 区域中的应用程序配置指向以前的辅助数据库,故障转移后,该数据库将成为完全可访问的新主数据库。
  • 启动故障转移组从辅助实例进行的计划内故障转移
  • 按照在恢复后配置数据库指南完成恢复。

验证

通过验证恢复后的应用程序完整性(包括连接性、基本功能测试,或演练验收所需的其他验证)来完成演练。

若要了解详细信息,请查看: