Azure AI 健康状况见解中的可靠性

本文介绍了 Azure AI 健康状况见解中的可靠性支持,并涵盖了通过可用性区域实现区域复原能力和通过灾难恢复实现跨区域复原能力。 有关 Azure 中可靠性的更详细概述,请参阅 Azure 可靠性

在 Azure 门户中创建健康状况见解资源时,需指定一个区域。 然后,资源及其所有操作都将与该特定的 Azure 区域保持关联。 有时我们会遇到影响整个区域的网络问题,这种情况比较罕见,但也不是没有可能。 如果解决方案需要始终保持可用,则应将其设计为可故障转移到另一区域,或者将工作负荷分散到两个或更多个区域。

可用性区域支持

Azure 可用性区域是每个 Azure 地区内的至少三个在物理上独立的数据中心组。 每个区域中的数据中心都配备了独立的电源、冷却系统和网络基础结构。 在本地区域发生故障的情况下,设计可用性区域,以便一个区域受到影响时,其余两个区域支持区域服务、容量和高可用性。

故障范围包括软件和硬件故障,以及地震、洪水和火灾等事件。 容错是通过 Azure 服务的冗余和逻辑隔离来实现的。 有关 Azure 中可用性区域的详细信息,请参阅地区和可用性区域。

已启用 Azure 可用性区域的服务旨在提供适当级别的可靠性和灵活性。 Azure AI 健康状况见解支持“区域”配置,这意味着实例被固定到特定区域。

区域故障体验

在区域范围的中断期间,客户应预见到性能会出现短时下降,直到服务的自我修复功能重新平衡基础容量以适应正常区域为止。 此功能不依赖于区域还原;Microsoft 托管服务的自我修复状态预期应会利用其他局部区域的容量来补偿丢失的区域。

多区域地理位置中的跨区域灾难恢复

灾难恢复 (DR) 是指从会导致故障时间的高影响事件(例如自然灾害或部署失败)中恢复。 不管灾难的原因是什么,最好的补救措施就是一个定义全面且经过测试的 DR 计划,以及一个主动支持 DR 的应用程序设计。

在 DR 方面,Azure 使用共同责任模型。 在共担责任模型中,Azure 会确保基线基础结构和平台服务可用。 对于这些服务,你负责设置适用于工作负载的灾难恢复计划。

对于 Azure AI 健康状况见解,该服务不会长期存储数据,而是仅在处理数据时存储数据。 如果发生区域故障,则与正在进行的请求关联的所有数据都将丢失。 如果解决方案需要始终保持可用,则应将其设计为可故障转移到另一区域,或者将工作负荷分散到两个或更多个区域。 当计划为 DR 部署应用程序时,了解 Azure 区域以及地理位置会很有帮助。 有关详细信息,请参阅 Azure 跨区域复制

后续步骤