使用资源运行状况排查 Azure SQL 数据库和 Azure SQL 托管实例的连接问题

适用于: Azure SQL 数据库 Azure SQL 托管实例

适用于 Azure SQL 数据库和 Azure SQL 托管实例的资源运行状况可以帮助你在 Azure 问题影响到 SQL 资源时进行诊断和获取支持。 它通知你有关资源的当前和过去运行状况的信息,并帮助你缓解问题。 在需要有关 Azure 服务问题的帮助时,资源运行状况将提供技术支持。

概述

运行状况检查

资源运行状况通过检查资源登录的成功与失败状态来确定 SQL 资源的运行状况。 目前,适用于 SQL 数据库资源的资源运行状况只会检查系统错误(而不是用户错误)导致的登录失败。 资源运行状况的状态每隔 1 - 2 分钟更新一次。

健康状况

可用

“可用”状态表示资源运行状况未检测到 SQL 资源中的系统错误导致的登录失败。

可用

已降级

“已降级”状态表示资源运行状况检测到大多数登录成功,但也有一部分登录失败。 这些问题很有可能是暂时性登录错误。 若要减轻暂时性登录错误导致的连接问题所造成的影响,请在代码中实施重试逻辑

已降级

不可用

“不可用”状态表示资源运行状况检测到 SQL 资源登录一直失败。 如果资源长时间保持此状态,请与支持人员联系。

不可用

未知

运行状况为“未知”指示资源运行状况未收到此资源的相关信息已超过 10 分钟。 尽管此状态不是资源状态的最终指示,但它是故障排除过程中一个重要的数据点。 如果资源正在按预期方式运行,资源状态会在几分钟后更改为“可用”。 如果资源遇到问题,“未知”运行状态可能暗示平台中的事件正在影响资源。

未知

历史信息

可在“资源运行状况”的“运行状况历史记录”部分中访问最多 14 天的运行状况历史记录。 该部分还包含资源运行状况报告的停机问题的停机原因(如果有)。 目前,Azure 以两分钟粒度显示数据库资源的停机时间。 实际停机时间可能小于一分钟。 平均为 8 秒。

停机原因

如果数据库遇到停机,将执行分析来确定原因。 在适当的情况下,资源运行状况的“运行状况历史记录”部分会报告停机原因。 停机原因通常在发生某个事件后的 45 分钟内发布。

计划内维护

Azure 基础结构定期执行计划内维护 - 升级数据中心内的硬件或软件组件。 在数据库接受维护期间,Azure SQL 可以终止某些现有连接并拒绝新连接。 在计划内维护期间出现的登录失败通常是暂时性的,重试逻辑可以帮助减轻影响。 如果持续遇到登录错误,请与支持人员联系。

重新配置

重新配置被视为暂时性状态,预期会不时地发生。 这些事件可能是负载均衡或软件/硬件故障触发的。 连接到云数据库的任何客户端生产应用程序应该实施可靠的连接重试逻辑,因为此逻辑有助于缓解这些情况,并且可让最终用户清晰地看到错误。

后续步骤