资源运行状况概述

Azure 资源运行状况有助于在服务问题影响到 Azure 资源时进行诊断和获取支持。 它会报告有关资源的当前和过去运行状况的信息,

Azure 状态报告影响大量 Azure 客户的服务问题。 资源运行状况提供资源运行状况的个性化仪表板。 资源运行状况显示由于 Azure 服务问题导致资源不可用的所有时间。 这些数据可方便你了解是否违反 SLA。

资源定义和运行状况评估

资源是 Azure 服务中的一个特定实例,例如虚拟机、Web 应用或 SQL 数据库。 资源运行状况依赖于各种 Azure 服务发出的信号来评估资源是否正常运行。 如果资源运行不正常,资源运行状况将分析其他信息以确定问题根源。 它还会报告 Microsoft 采取的用于解决此问题的操作或可以采取的用于解决问题的措施。

有关如何评估运行状况的详细信息,请参阅 Azure 资源运行状况中的资源类型和运行状况检查列表。

运行状况

资源的运行状况显示为以下状态之一。

可用

“可用”表示服务尚未检测到影响资源运行状况的事件。 如果过去 24 小时内资源在计划外停机后进行了恢复,则会看到“最近已解决”通知。

Status of Available for a virtual machine that has a

不可用

“不可用”表示服务已检测到影响资源运行状况的正在发生的平台或非平台事件。

平台事件

平台事件是由 Azure 基础结构的多个组件触发的。 它们包括计划的操作(例如,计划内维护)和意外事件(例如,计划外主机重启或预计在指定的时间段后会发生故障的已降级主机硬件)。

资源运行状况提供了有关事件和恢复过程的更多详细信息。 还可以通过它联系 Microsoft 支持人员,即使你没有有效的支持协议。

Status of Unavailable for a virtual machine because of a platform event

非平台事件

非平台事件是由用户的操作触发的。 例如:停止虚拟机或达到 Azure Redis 缓存的最大连接数。

Status of

Unknown

“未知”表示资源运行状况未收到此资源的相关信息已超过 10 分钟。 这通常发生在虚拟机已解除分配时。 尽管此状态不是资源状态的最终指示,但它可能是故障排除过程中一个重要的数据点。

如果资源正在按预期方式运行,资源状态会在几分钟后更改为“可用”。

如果资源遇到问题,“未知”运行状态可能意味着平台中的事件正在影响资源

Status of Unknown for a virtual machine

已降级

“已降级”表示资源已检测到性能降低,但仍可供使用

对于何时将资源报告为已降级,不同的资源具有自己的标准。

Status of Degraded for a virtual machine

对于虚拟机规模集,请访问资源运行状况状态在 Azure 虚拟机规模集中已“降级”页来了解详细信息。

不支持运行状况

“Health 不受支持”或“RP 没有关于资源的信息,或者你没有该资源的读/写访问权限”消息表示资源不支持运行状况指标。

若要了解哪些资源支持运行状况指标,请参阅支持的资源类型页。

发送到活动日志的资源运行状况事件

以下情况下,资源运行状况事件记录在活动日志中:

  • 为资源提交了批注,例如“ResourceDegraded”或“AccountClientThrottling”。
  • 已转换到“运行不正常”或从“运行不正常”转换过来的资源。
  • 资源运行时间超过 15 分钟。

以下资源运行状况转换不记录在活动日志中:

  • 转换为“未知”状态。
  • 从“未知”状态转换过来,如果满足以下条件:
    • 这是第一次转换。
    • 如果“未知”之前状态与之后的新状态相同。 (例如,如果资源从“运行正常”转换到“未知”,再转换回“运行正常”)。
    • 对于计算资源:当“运行不正常”时间少于 35 秒时,从“运行正常”转换到“运行不正常”,再转换到“运行正常”的虚拟机。

历史记录信息

注意

可以使用 Events - List By Subscription Id REST API 的 QueryStartTime 参数列出订阅中的当前服务运行状况事件并查询最长 1 年的数据,但目前在 Events - List By Single Resource REST API 下没有 QueryStartTime 参数,因此在列出给定资源的当前服务运行状况事件时无法查询最长 1 年的数据。

可以在 Azure 门户中资源运行状况的“运行状况历史记录”部分访问最多 30 天的历史记录。

List of Resource Health events over the last two weeks

根本原因信息

如果 Azure 具有关于平台启动的不可用性的根本原因的进一步信息,则该信息可能会在最初不可用后 72 小时内发布到资源运行状况。 此信息目前仅适用于虚拟机。

入门

若要为某个资源打开“资源运行状况”,请执行以下操作:

  1. 登录到 Azure 门户。
  2. 浏览资源。
  3. 在左窗格中的资源菜单上,选择“资源运行状况”
  4. 从运行状况历史记录网格中,你可以下载 PDF 或单击“共享/管理”RCA 按钮。

Opening Resource Health from the resource view

Screenshot of the Resource Health pane in the Azure portal. The Unavailable message and Download as PDF and Share/Manage RCA buttons are highlighted.

此外,还可以通过选择“所有服务”,并在筛选器文本框中键入“资源运行状况”来访问“资源运行状况”。 在“帮助 + 支持”窗格中,选择 资源运行状况

Opening Resource Health from

后续步骤

若要了解有关资源运行状况的详细信息,请参阅以下参考文章: