Compartir a través de

Azure DocumentDB 中的可靠性

本文包含有关可用性区域跨区域灾难恢复与业务连续性的详细信息,适用于 Azure DocumentDB。

有关Azure可靠性的体系结构概述,请参阅 Azure 可靠性

可用性区域支持

可用性区域 是 Azure 区域内在物理上独立的若干数据中心组。 当某个区域发生故障时,服务可以切换到其他可用的区域。

若要获得可用性区域支持,必须启用高可用性 (HA)。

HA 通过维护群集中每个分片的备用副本,从而避免数据库停机。 如果分片出现故障,Azure DocumentDB 将传入的连接从失败的分片切换到其备用副本。

在支持可用性区域的区域中启用 HA 时,HA 副本分片将预配到与其主分片不同的可用性区域中。 除非主分片发生故障,否则 HA 副本不会接收来自客户端的请求。

如果禁用 HA,则每个分片都有自己的本地冗余存储(LRS),其中包含由 Azure 存储 服务维护的三个同步副本。 如果出现单个副本故障,Azure 存储服务会检测故障,并透明地重新创建相关数据。 有关 LRS 存储持续性,请参阅“冗余选项摘要”。 但是,如果某个区域发生故障,则可能会造成长时间停机和可能的数据丢失风险。

创建启用可用性区域的资源

若要启用可用区,您必须在创建群集时或在 Azure 门户的现有群集Scale部分中启用高可用性(HA)。

跨区域灾难恢复和业务连续性

灾难恢复(DR)是指组织用来从高影响事件(例如自然灾害或导致停机和数据丢失的部署)中恢复的做法。 不管灾难的原因是什么,最好的补救措施就是一个定义全面且经过测试的 DR 计划,以及一个主动支持 DR 的应用程序设计。 在开始创建灾难恢复计划之前,请参阅 有关设计灾难恢复策略的建议

对于 DR,Azure使用共享责任模型。 在此模型中,Microsoft确保基线基础结构和平台服务可用。 但是,许多Azure服务不会自动复制数据或从失败的区域回退到另一个启用的区域。 对于这些服务,你负责设置适用于工作负载的灾难恢复计划。 在 Azure 平台即服务(PaaS)产品/服务上运行的大多数服务都提供支持 DR 的功能和指南。 可以使用服务特定的功能来支持快速恢复,从而帮助制定灾难恢复计划。

Azure DocumentDB 不提供内置的自动故障转移或灾难恢复。 在解决方案扩展过程中,规划高可用性是其中关键一步。

单区域地理位置中的灾难恢复

若要最大限度地提高运行时间,请提前计划,以保持业务连续性,并准备使用 Azure DocumentDB 进行灾难恢复。

虽然Azure服务旨在最大程度地提高运行时间,但可能发生计划外服务中断。 灾难恢复计划可确保用户有适当的策略来处理区域服务中断。

Azure DocumentDB 定期自动备份数据。 自动备份不会影响数据库操作的性能或可用性。 所有备份都会在后台自动执行,并独立于存储服务中的源数据进行存储。 这些自动备份在意外删除或修改资源后需要原始版本的情况下非常有用。

根据群集当前处于活动状态还是最近才被删除,自动备份将以不同的时间间隔保留。

保留期
活动的集群 35
已删除的群集 7

设计以实现高可用性

应为运行生产工作负荷的关键 Azure DocumentDB 群集启用高可用性(HA)。 在启用 HA 的群集中,每个分片都充当主分片,同时在另一个可用性区域中预配热备分片。 默认情况下,主分片和辅助分片之间的复制是同步的。 在收到来自数据库的响应之前,主分片和辅助分片(热备用分片)上都会保留对数据库所做的任何修改。

该服务会为集群的每个主分片和辅助分片维护运行状况检查,并保持心跳信号。 如果主分片由于区域或地区中断而变得不可用,则辅助分片将自动升级为新的主分片,并为新的主分片构建后续辅助分片。 此外,如果辅助分片变为不可用状态,服务会自动创建一个新的辅助分片,其中包含来自主分片的完整数据副本。

如果服务触发了从主分片到辅助分片的故障转移,连接将在后台无缝路由到新的主分片。

主分片和辅助分片之间的同步复制保证在发生故障转移时不会出现任何数据丢失。

后续步骤