使用 Azure 门户为 Azure SQL 托管实例创建警报

适用于:Azure SQL 托管实例

本文说明如何使用 Azure 门户为 Azure SQL 托管实例中的数据库设置警报。 本文还提供了设置警报规则的最佳做法。

设置新的指标警报

可以根据监控指标或事件接收 Azure 服务的警报。 有关详细信息,请参阅指标警报

  • 指标值 - 当指定指标的值超出分配的阈值时,会触发警报。
  • 活动日志事件 - 警报可以在发生 每个 事件时都触发,也可以仅在发生特定数量的事件时触发。
  • 资源运行状况 - 与资源运行状况事件相关的警报,包括事件是平台还是用户发起的。
  • 日志搜索 - 日志分析搜索捕获的日志数据,包括自定义日志搜索或准备的示例查询。

可以配置警报以在其触发时执行以下操作:

  • 向服务管理员和共同管理员发送电子邮件通知
  • 向指定的其他电子邮件发送电子邮件,包括 Azure Resource Manager 角色。
  • 向组发送电话号码
  • 启动自动化 runbook
  • 调用 Azure 函数
  • 启动事件中心操作
  • 选择逻辑应用操作
  • 调用 Webhook 或安全的 Webhook

可使用以下项配置并获取预警规则相关信息:

适用于 Azure SQL 托管实例的警报指标

重要

警报指标仅适用于 SQL 托管实例。 警报指标不适用于 SQL 托管实例中的单个数据库。 另一方面,数据库诊断遥测可按诊断日志的形式提供。

以下 SQL 托管实例指标可用于警报配置:

跃点数 说明 度量单位或可能值
CPU 平均百分比 选定时间段内 CPU 使用率的平均百分比。 0-100(百分比)
已读取的 IO 字节数 选定时间段内已读取的 IO 字节数。 字节
已写入的 IO 字节数 选定时间段内已写入的 IO 字节。 字节
IO 请求计数 选定时间段内的 IO 请求计数。 数值
预留的存储空间 当前为托管实例预留的最大存储空间。 随资源缩放操作所发生的变化。 MB(兆字节)
已使用的存储空间 选定时间段内已使用的存储空间。 随数据库和实例的存储消耗所发生的变化。 MB(兆字节)
虚拟核心计数 为托管实例预配的 vCore 数量。 随资源缩放操作所发生的变化。 4-80 (vCore)

使用 Azure 门户创建指标的警报规则

  1. 在“Azure 门户”中,查找想要监视的托管实例,并选择该实例。

  2. 在监视部分中选择“指标”菜单项。

  3. 在“指标”下拉菜单上,选择要设置警报的指标之一(示例中显示了已使用的存储空间)。

  4. 使用“聚合”选择聚合时间段 - 在给定时间段内达到的平均值、最小值或最大值(Avg、Min 或 Max)。

  5. 选择“新建警报规则”。

    Azure 门户中的指标资源管理器的屏幕截图,其中选择了“已使用的存储空间”指标。

  6. 在“警报逻辑”部分中:

    字段 说明
    阈值 选择是否应根据静态值或动态值评估阈值。
    静态阈值使用配置的阈值评估规则。
    动态阈值使用机器学习算法持续了解指标行为模式并自动计算阈值。 可以详细了解如何对指标警报使用动态阈值
    聚合类型 聚合类型选项有“最小值”、“最大值”或“平均值”(在聚合粒度期间内)
    运算符 选择用于将指标值与阈值进行比较的运算符。
    单位 如果所选指标信号支持不同的单位(例如字节、KB、MB 和 GB),并且如果选择了“静态”阈值,请输入条件逻辑的单位。
    阈值 如果选择了“静态”阈值,请输入条件逻辑的阈值。 阈值是根据运算符和聚合条件计算的警报值。
    阈值敏感度 如果选择了“动态”阈值,请输入敏感度级别。 敏感度级别会影响触发警报所需的指标系列模式偏差量。
    聚合粒度 选择用于使用聚合类型函数对数据点进行分组的间隔。 选择大于“评估频率”的“聚合粒度”(周期),以降低错过对已添加的时序进行首次评估的可能性。
    评估频率 选择警报规则的运行频率。 选择小于聚合粒度的频率,以生成用于评估的滑动窗口。
  7. 在“何时评估”部分:

    字段 说明
    检查间隔 选择警报规则检查条件是否满足的频率。
    回溯期间 选择回溯期,即每次检查数据时要回溯的时间段。 例如,每隔 1 分钟查看过去的 5 分钟。

    在屏幕截图所示的示例中,值 1840876 MB 表示阈值为 1.8 TB。 由于示例中的操作符设置为“大于”,所以如果 SQL 托管实例上的存储空间消耗量超过 1.8 TB,就会触发警报。 存储空间指标的阈值必须以 MB 表示。

    Azure 门户中“创建警报规则”对话框的“条件”选项卡的屏幕截图。突出显示了“警报逻辑”和“何时评估”部分。

  8. 选择页面底部的“下一步:操作 >”或“操作”选项卡。

  9. 在“操作”选项卡中,选择或创建所需的操作组。 此操作定义在触发警报时发生的操作(例如,在手机上发送电子邮件)。 从“选择操作组”窗格中选择现有“操作组”,或在订阅中“创建操作组”

    1. 选择“+ 创建操作组”。

      Azure 门户中“创建警报规则”对话框的“操作”选项卡的屏幕截图。突出显示了“创建操作组”按钮。

    2. 输入操作组名称和显示名称,然后选择“区域”:

      选项 行为
      全局 操作组服务决定操作组的存储位置。 操作组至少保留在两个区域中,以确保区域复原能力。 可以在任何地理区域中处理操作。

      服务健康状况警报而执行的短信和电子邮件操作在出现 Azure 实时站点事件时可复原。

      Azure 门户中“创建操作组”对话框的“基本信息”选项卡的屏幕截图。

    3. 选择页面底部的“下一步: 通知>”或“通知”选项卡。

    4. 在“通知”选项卡中,定义触发警报时要发送的通知。

      • 通知类型:选择“电子邮件 Azure 资源管理器角色”,向分配了特定订阅级别的 Azure 资源管理器角色的用户发送电子邮件,或选择“电子邮件/短信”向特定收件人发送各种通知类型。

      • 名称:输入通知的唯一名称。

      • 详细信息:根据所选的通知类型,输入电子邮件地址、电话号码或其他信息。

      • 常见警报架构:可以选择启用常见警报架构,获得单个可扩展的统一警报有效负载跨 Monitor 中的所有警报服务的优势。 有关此架构的详细信息,请参阅常见警报架构

      “创建操作组”对话框的“通知”选项卡的屏幕截图。电子邮件通知的配置信息可见。

    5. 如果需要定义在触发警报时要触发的操作列表,请选择“操作”选项卡,并定义操作。

      Azure 门户中“创建操作组”对话框的“操作”选项卡的屏幕截图,其中突出显示了“操作类型”和“名称”字段。

    6. 如果要将键值对分配给操作组,请选择“标记”选项卡。否则,请跳过此步骤。 通过使用标记,可以对 Azure 资源进行分类。 标记适用于所有 Azure 资源、资源组和订阅。

      Azure 门户中“创建操作组”对话框的“标记”选项卡的屏幕截图。“名称”和“值”框中的值可见。

    7. 要查看设置,请选择“查看 + 创建”选项卡。此步骤会快速检查输入,以确保已输入所有必需信息。 如果有问题,将在此处报告。 查看设置后,选择“创建”以创建操作组。

      Azure 门户中“创建操作组”对话框的“查看和创建”选项卡的屏幕截图,其中突出显示了“创建”按钮。

  10. 在“详细信息”选项卡中,填写用于记录的警报规则详细信息和设置,然后选择严重性类型。

    Azure 门户中“创建警报”对话框的“详细信息”选项卡的屏幕截图。

  11. 在“标记”选项卡中,在预警规则资源上设置任何必需的标记。 否则,请跳过此步骤。

    Azure 门户中“创建警报规则”对话框的“标记”选项卡的屏幕截图。“名称”和“值”框中的值可见。

  12. 在“审核 + 创建”选项卡中,将运行验证并告知所有问题。 通过验证并查看设置后,选择页面底部的“创建”按钮。

    Azure 门户中“创建警报规则”对话框的“查看 + 创建”选项卡的屏幕截图。突出显示了“创建”按钮。

新的警报规则将在几分钟内激活,并根据设置触发。

在 Azure 门户中创建更多警报规则

还可以为 SQL 托管实例创建“活动日志事件”、“资源运行状况”和“日志搜索”的警报规则。

有关详细信息,请参阅:

  1. 在“Azure 门户”中,查找想要监视的资源并选中它。
  2. 在“资源”菜单的“监视”下,选择“警报”。 对于不同的资源,文本和图标可能会略有不同。
  3. 选择“+ 创建”按钮,然后选择“警报规则”
  4. 在“创建警报规则”页上,“范围”被自动配置为资源。

    注意

    为了避免许多独立警报的蔓延,可能需要为订阅、资源组或 Azure SQL 数据库逻辑服务器中某种类型的所有资源配置警报。 使用“范围”选项卡可更改新警报规则的范围。

在 Azure SQL 托管实例中,捕获事件并在“资源运行状况”信号类别中为资源服务运行状况配置警报。

  1. 在“条件”窗格中,选择“查看所有信号”

  2. 在“选择信号”窗格中,选择“资源运行状况”。 选择“应用”。

  3. “事件状态”、“当前资源状态”、“上一个资源状态”和“资源类型”下拉列表提供用于为许多可能的资源运行状况更改配置警报的选项。 默认情况下,选择所有可能的状态和状态更改,以便发送警报,以检测和解决服务运行状况问题。

    字段 说明
    事件状态 选择资源运行状况事件的状态。 值为“活动”、“进行中”、“已解决”和“已更新”。
    当前资源状态 选择当前资源状态。 值为“可用”、“已降级”和“不可用”。
    旧资源状态 选择以前的资源状态。 值为“可用”、“已降级”、“不可用”和“未知”。
    原因类型 选择资源运行状况事件的原因。 值为“平台发起”、“未知”和“用户发起”。
  4. 选择“下一步:操作”>

  1. 从“选择操作组”窗格中选择现有“操作组”,或在订阅中“创建操作组”。 操作组用于定义在发生警报条件时要执行的操作。 此操作定义在触发警报时发生的操作(例如发送电子邮件)。
    1. 也可通过“使用快速操作”功能创建新操作组并提供电子邮件通知目标。
  2. 选择“下一步:详细信息”>
  3. 提供“订阅”和“资源组”
  4. 默认情况下,警报规则的严重性为“3 - 信息性”。 你可以根据需要调整警报规则的“严重性”
  5. 提供“警报规则名称”。 提供描述(可选但推荐)。
  6. 为警报规则提供一个区域
  7. 选择警报规则的标识。 可以选择让警报规则使用系统分配的托管标识 (SAMI)、用户分配的托管标识 (UAMI)。 有关详细信息,请参阅标识
  8. 在“高级选项”下:
    1. 确保“创建时启用”,在创建警报规则后立即开始运行。
    2. 默认情况下启用“自动解决警报”选项。 这将使警报成为有状态警报,这意味着当不再满足条件时,警报将得到解决。
  9. 选择“下一步:标记”>
  10. 考虑使用 Azure 标记。 例如,用于确定资源创建者的“所有者”或“创建者”标记,以及确定此系统是生产环境还是开发环境等的“环境”标记。有关详细信息,请参阅为 Azure 资源开发命名和标记策略
  11. 选择“查看 + 创建”。
  12. 选择“创建”。 很快,警报将被激活。

验证警报

注意

若要抑制干扰警报,请参阅使用操作规则抑制警报

设置警报规则后,请验证警报触发情况及其频率是否符合需求。 对于此页上显示的关于针对已使用的存储空间设置警报的示例,如果警报选项是电子邮件,则你可能会收到电子邮件,如下所示:

触发警报时发送的电子邮件示例的屏幕截图。

电子邮件显示警报名称、阈值的详细信息以及触发警报的原因,可帮助你验证警报并对警报进行故障排除。

  • 选择“在 Azure 门户中查看”按钮,以在 Azure 门户中查看通过电子邮件收到的警报。
  • 选择“查看规则 >”以查看或编辑触发警报的警报规则。
  • 选择“查看资源 >”以查看触发警报的托管实例。

管理警报规则

注意

需要通过 Azure 门户资源菜单的“警报”菜单管理现有警报。 无法从托管实例资源窗格修改现有警报。

若要查看、暂停、激活、修改和删除现有警报:

  1. 使用 Azure 门户搜索搜索警报。 选择“警报”。

    Azure 门户中搜索框的屏幕截图。突出显示了“警报”搜索词和搜索结果中的“警报”服务。

    或者,也可以选择 Azure 导航栏上的“警报”(如果已配置)。

  2. 在“警报”窗格中,选择“警报规则”

    Azure 门户中的“警报”页的屏幕截图,其中突出显示了“警报规则”按钮。

  3. 选择单个现有警报规则进行管理。 可以根据你的偏好修改和调整现有的活动规则。 也可以不删除活动规则而是将其挂起。