“状态”页

Azure Databricks Status Page概述了所有核心Azure Databricks服务。 还可以订阅单个服务组件的状态更新,并在订阅更改的服务状态时收到警报。

下图是屏幕截图,而不是实时链接。 若要查看实际当前状态,请单击此链接: “状态”页

Azure状态页面

状态页按Azure区域细分。 选择四个主要地区(美洲、欧洲、亚太或中东和非洲)之一,以显示所选地区中所有的活动区域。

服务状态按区域进行跟踪。 服务在不同地区可能具有不同的状态。

除了Azure Databricks服务,状态页还显示整个Azure的状态。 Azure服务状态由Microsoft提供。 它位于Azure Databricks之外。

服务图标

服务状态由颜色编码图标指示。

这些图标用于单个服务,以及整个地理区域和外部服务。

服务正常运行 所有服务都在正常运行。

服务已降级 一个或多个服务正在降级状态下运行。

服务已关闭 一个或多个服务当前已关闭。

计划内维护 已安排一个或多个服务进行计划内维护。

主动维护 一个或多个服务因执行计划内维护而关闭。

将鼠标悬停在状态页的图标上,以显示当前状态的摘要。

事件页面

选择黄色、红色或蓝色的服务状态图标来显示详细的事件页。

事件页突出显示“事件状态”、受影响的“组件”,以及受影响的“位置”。 解决事件后,事件页将显示事件的持续时间(以分钟为单位)。

详细信息包含在事件页的“更新”部分中。 你可以在此处找到有关事件的最新信息以及任何已知的缓解措施。

订阅

除了查看状态页外,你还可以选择通过以下一种(或多种)方法订阅更新:

注意

你可以订阅每个区域中的各个服务。 这可确保你只收到与你相关的服务的警报。

Email

要订阅电子邮件通知:

  1. 单击“订阅更新”(位于状态页的右上角)。

  2. 单击电子邮件

  3. 输入电子邮件地址。

  4. 单击 “订阅”

  5. 在“管理订阅”页上,选择要跟踪的所有组件。

  6. 单击“保存订阅”以确认所做的选择。

管理现有订阅:

  1. 单击“订阅更新”(位于状态页的右上角)。

  2. 单击电子邮件

  3. 单击“管理现有订阅”。

  4. 输入具有活动订阅的电子邮件地址。

  5. 单击“管理订阅”,系统会通过电子邮件向你发送用于管理订阅的链接。

  6. 打开电子邮件,并单击链接。

  7. “管理订阅 ”页上,选择要跟踪的所有组件并取消选择要删除的所有组件。

  8. 单击“保存订阅”以确认所做的选择。

Webhook

要订阅 Webhook 通知:

  1. 单击“订阅更新”(位于状态页的右上角)。

  2. 单击“WEBHOOK”。

  3. 输入 Webhook 的 URL。

  4. 输入电子邮件地址。

  5. 单击 “订阅”

  6. 在“管理订阅”页上,选择要跟踪的所有组件。

  7. 单击“保存订阅”以确认所做的选择。

管理现有订阅:

  1. 单击“订阅更新”(位于状态页的右上角)。

  2. 单击“WEBHOOK”。

  3. 单击“管理现有订阅”。

  4. 输入用于 Webhook 的 URL。

  5. 输入具有活动订阅的电子邮件地址。

  6. 单击“管理订阅”,系统会通过电子邮件向你发送用于管理订阅的链接。

  7. 打开电子邮件,并单击链接。

  8. “管理订阅 ”页上,选择要跟踪的所有组件并取消选择要删除的所有组件。

  9. 单击“保存订阅”以确认所做的选择。

Webhook 负荷示例

下面是一个可以通过 webhook POST 的 JSON 负载示例。

{
  "id": "552adb8331a9553b11000008",
  "message_id": "542adb8331a9553b11000008",
  "title": "Server Upgrades",
  "datetime": "2015-04-03T18:38:57.326Z",
  "current_status": "Planned Maintenance",
  "infrastructure_affected": [
    { "component": "551ed627b556f14210000005", "container": "551ed5ac590f5a3b10000006" },
    { "component": "551ed627b556f14210000005", "container": "551ed5b1c9f9404110000005" }
  ],
  "components": [{ "name": "Chat Service", "_id": "551ed627b556f14210000005" }],
  "containers": [
    { "name": "East Server", "_id": "551ed5ac590f5a3b10000006" },
    { "name": "West Server", "_id": "551ed5b1c9f9404110000005" }
  ],
  "details": "We've completed upgrades for all East Servers. No issues so far. Moving on to West Servers next. Updates to follow.",
  "maintenance_url": "https://status.io/pages/maintenance/5516e01e2e55e4e917000005/5116e01e2e33e4e413000001",
  "status_page_url": "https://status.io/pages/5516e01e2e55e4e917000005"
}

开放状态 API

除了在浏览器中查看服务运行状况之外,还可以使用公共 Status Page API 以编程方式检索Azure Databricks服务状态。

Azure Databricks状态页公开只读终结点,该终结点以 JSON 格式返回当前系统状态的计算机可读快照。 可以使用单个 HTTP GET 请求查询终结点,不需要身份验证。

终结点:https://status.azuredatabricks.net/1.0/status/5d49ec10226b9e13cb6a422e

示例请求

curl https://status.azuredatabricks.net/1.0/status/5d49ec10226b9e13cb6a422e

响应为 JSON,包括以下内容:

  • 总体系统状态
  • 单个服务组件的状态
  • 当前事件
  • 计划性维护(如果有)
  • 时间戳和描述性状态文本
示例响应

下面是显示 JSON 有效负载结构的截断示例。 实际响应包括所有服务和区域。

{
  "result": {
    "status_overall": {
      "updated": "2026-03-31T00:19:18.679Z",
      "status": "Operational",
      "status_code": 100
    },
    "status": [
      {
        "id": "5d02c32d086f1d04b97eb367",
        "name": "Compute",
        "status": "Operational",
        "status_code": 100,
        "containers": [
          {
            "id": "5d02c768b2e5f00a022b5fb2",
            "name": "China East 2 1",
            "updated": "2026-03-31T00:19:18.253Z",
            "status": "Operational",
            "status_code": 100
          }
        ],
        "updated": "2026-03-31T00:19:18.350Z"
      }
    ],
    "incidents": [],
    "maintenance": {
      "active": [],
      "upcoming": []
    }
  }
}

响应代码

响应包括两个用于不同用途的数字字段:

  • status:严重性或影响级别 - “它有多糟糕?”
  • state:事件或维护事件的生命周期阶段 - “我们在响应中在哪里?”

这些值显示在事件和维护消息中。 以下各节介绍了每个字段的可能值。

事件生命周期(state 值)

state 字段指示事件或维护事件在其进展中的位置:

  • 100 - 正在调查:此问题已被检测到,目前正在进行初步调查。
  • 200 - 已确定:原因已知,缓解工作正在进行中。
  • 300 - 监视:已应用修补程序,团队正在监视稳定性。
  • 400 — 已解决:事件或维护活动已完成。
服务严重性(status 值)

status 字段表示发布消息时的影响级别:

  • 100 — 操作:服务正常运行。
  • 200 - 计划内维护:维护活动正在进行或计划。
  • 300 — 性能下降:服务可用但受损。
  • 400 — 部分服务中断:某些功能或组件不可用。
  • 500 — 主要服务中断:广泛的服务中断。
维护事件

维护事件使用相同的具有不同语义的字段:

  • 维护 status:通常 200,指示正在进行中的或已安排的维护。
  • 维护 state
    • 100 — 已宣布或计划
    • 200 — 正在进行的维护
    • 300 — 监视完成
    • 400 — 已完成