创建或编辑指标警报规则

本文介绍如何创建新的指标警报规则或编辑现有指标警报规则。 若要了解有关警报的详细信息,请参阅 警报概述

通过组合要监视的资源、资源的监视数据以及要触发警报的条件来创建警报规则。 然后,可以定义 作组警报处理规则 ,以确定触发警报时会发生什么情况。

可以定义这些警报规则触发的警报中包含的有效负载。 它们可以包含使用 常见警报架构的有效负载,或 每个警报类型建议较少的单独架构

先决条件

若要创建指标警报规则,必须具有以下权限:

  • 对警报规则的目标资源具有读取权限。
  • 对在其中创建警报规则的资源组的写入权限。 如果要从 Azure 门户创建警报规则,则默认在目标资源所在的同一资源组中创建警报规则。
  • 读取与警报规则关联的任何作组的权限(如果适用)。

从门户主页创建或编辑警报规则

执行以下步骤:

  1. 门户中,选择“ 监视>警报”。

  2. 打开 “+ 创建 ”菜单,然后选择 “警报规则”。

    显示创建新警报规则的步骤的屏幕截图。

从特定资源创建或编辑警报规则

执行以下步骤:

  1. 门户中,导航到资源。

  2. 从左窗格中选择 “警报 ”,然后选择“ + 创建>警报规则”。

  3. 警报规则的范围设置为所选资源。 继续设置警报规则的条件。

    显示从所选资源创建新警报规则的步骤的屏幕截图。

编辑现有警报规则

执行以下步骤:

  1. 门户中,从主页或从特定资源中,从左窗格中选择 “警报 ”。

  2. 选择 “警报规则”。

  3. 选择要编辑的警报规则,然后选择“ 编辑”。

    显示编辑现有警报规则的步骤的屏幕截图。

  4. 选择要编辑设置的警报规则的任何选项卡。

配置警报规则的范围

执行以下步骤:

  1. “选择资源 ”窗格中,设置警报规则的范围。 可以按 订阅资源类型资源位置进行筛选。

  2. 选择应用

    显示用于创建新警报规则的“选择资源”窗格的屏幕截图。

配置警报规则条件

执行以下步骤:

  1. 在“ 条件 ”选项卡上,选择 “信号名称 ”字段时,最常用的信号将显示在下拉列表中。 选择其中一个常用信号,或者如果要为条件选择其他信号,请选择“ 查看所有信号 ”。

    显示创建警报规则时的热门信号的屏幕截图。

  2. (可选)如果选择在上一步 中查看所有信号 ,请使用 “选择信号 ”窗格搜索信号名称或筛选信号列表。 筛选依据:

    下表描述了可用于指标警报规则的服务:

    信号源 Description
    平台 对于指标信号,监视器服务是指标命名空间。 “平台”表示指标由资源提供程序(即 Azure)提供。
    Azure.ApplicationInsights Application Insights SDK 发送的客户报告的指标。
    Azure.VM.Windows.GuestMetrics VM 来宾指标,由 VM 上运行的扩展收集。 可以包括内置作系统性能计数器和自定义性能计数器。
    <自定义命名空间> 自定义指标命名空间,其中包含使用 Azure Monitor 指标 API 发送的自定义指标。

    选择 信号名称应用

  3. 预览 预览 部分中所选指标信号的结果。 为以下字段选择值。

    领域 Description
    时间范围 要包含在结果中的时间范围。 可以是过去六个小时到上周。
    时序 要包含在结果中的时序。
  4. 在“警报逻辑”部分中:

    领域 Description
    门槛 选择是否应根据静态值或动态值评估阈值。
    静态阈值使用配置的阈值来评估规则。
    动态阈值使用机器学习算法持续了解指标行为模式,并计算意外行为的相应阈值。 可以详细了解如何对指标警报使用动态阈值
    Operator 选择用于将指标值与阈值进行比较的运算符。
    如果你使用的是动态阈值,则预警规则可以根据同一预警规则中上限和下限的指标行为使用定制的阈值。 选择以下运算符之一:
    • 大于上限或低于阈值(默认值)
    • 大于上限阈值
    • 低于阈值
    聚合类型 选择要应用于数据点的聚合函数:Sum、Count、Average、Min 或 Max。
    阈值 如果选择了“静态”阈值,请输入条件逻辑的阈值。
    单位 如果所选指标信号支持不同的单位(例如字节、KB、MB 和 GB),并且如果选择了“静态”阈值,请输入条件逻辑的单位。
    阈值敏感度 如果选择了“动态”阈值,请输入敏感度级别。 敏感度级别会影响触发警报所需的指标系列模式偏差量。
    :阈值严格且接近指标系列模式。 预警规则在偏差最小的情况下触发,因此会生成更多的警报。
    中等:阈值不太紧,更平衡。 相比高敏感度(默认设置),警报数量更少。
    :阈值松散,允许与指标系列模式的偏差更大。 只会在偏差较大的情况下触发预警规则,因此生成的警报较少。
  5. (可选)可以按维度配置拆分。

    维度是名称值对,其中包含有关指标值的更多数据。 通过使用维度,可以筛选指标并监视特定的时序,而不是监视所有维度值的聚合。

    如果选择多个维度值,则组合产生的每个时序都会触发其自己的警报,并单独收费。 例如,存储帐户的事务指标可以具有一个 API 名称维度,其中包含每个事务调用的 API 的名称(例如 GetBlob、DeleteBlob 和 PutPage)。 可以选择在特定 API 中存在大量事务(聚合数据)时触发警报。 或者,仅当特定 API 的事务数较高时,才能使用维度发出警报。

    领域 Description
    维度名称 维度可以是数字列或字符串列。 维度用于监视特定的时序,并为触发的警报提供上下文。
    Azure 资源 ID 列上拆分会使指定的资源进入警报目标。 如果检测到,将自动选择 ResourceID 列,并将触发的警报的上下文更改为记录的资源。
    Operator 维度名称和值上使用的运算符。
    维度值 维度值基于过去 48 小时内的数据。 选择 “添加自定义值 ”以添加自定义维度值。
    包括所有未来值 选择此字段可包含添加到所选维度的任何未来值。
  6. 在“何时评估”部分:

    领域 Description
    检查每个 选择警报规则检查条件是否满足的频率。
    回溯期 选择每次检查数据时要查看的距离。 例如,每 1 分钟一次,回头看 5 分钟。
  7. (可选)如果使用动态阈值,请在 “高级选项” 部分中指定特定时间段内有多少次失败触发警报。 例如,可以指定仅当过去一小时内发生三次故障时触发警报。 应用程序业务策略应确定此设置。

    为以下字段选择值:

    领域 Description
    冲突数 触发警报的已配置时间段内的冲突数。
    评估期 发生冲突的时间段。
    在之前忽略数据 使用此设置可以选择从中开始计算动态阈值的指标历史数据的日期。 例如,如果资源在测试模式下运行,并且已移动到生产环境,则可能需要在测试资源时忽略指标行为。
  8. 选择“完成”。 配置警报规则条件后,可以配置警报规则详细信息以完成警报的创建,也可以选择将作和标记添加到警报规则。

配置警报规则作

(可选)按照以下步骤将作添加到警报规则:

  1. 选择 “作 ”选项卡。

  2. 选择或创建所需的 作组

    显示创建新警报规则时“作”选项卡的屏幕截图。

配置警报规则详细信息

执行以下步骤:

  1. 在“ 详细信息 ”选项卡上,定义 “项目详细信息”。

    • 选择 订阅
    • 选择 资源组
  2. 定义 警报规则详细信息

    显示创建新警报规则时“详细信息”选项卡的屏幕截图。

  3. 选择 严重性

  4. 输入警报规则名称和警报规则说明的值。

  5. (可选)在 “高级选项 ”部分中,可以设置多个选项。

    领域 Description
    创建后启用 选择警报规则以在创建警报规则后立即开始运行。
    自动解决警报 选择以使警报有状态。 当警报为有状态时,当不再满足条件时,警报将得到解决。
    如果未选中此复选框,则指标警报是无状态的。 每当满足条件时都会触发无状态警报,即使警报已触发也是如此。
    无状态指标警报的通知频率因警报规则的配置频率而异:
    警报频率小于 5 分钟:尽管条件继续满足,但通知将在 1 到 6 分钟之间发送。
    警报频率超过 5 分钟:当条件继续满足时,将在配置的频率之间发送通知,并将频率的值加倍。 例如,对于频率为 15 分钟的警报规则,通知在 15 到 30 分钟之间发送。
  6. (可选)在 “自定义属性 ”部分中,如果此警报规则包含作组,则可以添加自己的属性以包含在警报通知有效负载中。 可以在作组调用的作中使用这些属性,例如 Webhook、Azure 函数或逻辑应用作。

    自定义属性使用静态文本、从警报有效负载中提取的动态值或两者的组合指定为键/值对。

    从警报有效负载中提取动态值的格式为: ${<path to schema field>}。 例如: ${data.essentials.monitorCondition}

    使用 通用警报架构 的格式指定有效负载中的字段,无论为警报规则配置的作组是否使用通用架构。

    注释

    • 自定义属性将添加到警报的有效负载中,但它们不会显示在电子邮件模板或 Azure 门户中的警报详细信息中。

    显示用于创建新警报规则的自定义属性的屏幕截图。

    以下示例使用 自定义属性 中的值来利用使用常见警报架构的有效负载中的数据。

    此示例创建一个 附加详细信息 标记,其中包含有关窗口开始时间和窗口结束时间的数据:

    • 名称:Additional Details
    • 价值: Evaluation windowStartTime: ${data.alertContext.condition.windowStartTime}. windowEndTime: ${data.alertContext.condition.windowEndTime}
    • 结果: AdditionalDetails:Evaluation windowStartTime: 2023-04-04T14:39:24.492Z. windowEndTime: 2023-04-04T14:44:24.492Z

    此示例添加有关解析或触发警报的原因的数据:

    • 名称:Alert ${data.essentials.monitorCondition} reason
    • 价值: ${data.alertContext.condition.allOf[0].metricName} ${data.alertContext.condition.allOf[0].operator} ${data.alertContext.condition.allOf[0].threshold} ${data.essentials.monitorCondition}. The value is ${data.alertContext.condition.allOf[0].metricValue}
    • 潜在结果:
      • Alert Resolved reason: Percentage CPU GreaterThan5 Resolved. The value is 3.585
      • Alert Fired reason": "Percentage CPU GreaterThan5 Fired. The value is 10.585
  7. 配置范围、条件和详细信息后,可以随时选择 “审阅 + 创建 ”按钮。

配置警报规则标记

(可选)按照以下步骤将标记添加到警报规则:

  1. 选择“ 标记 ”选项卡。

  2. 在警报规则资源上设置任何必需的标记。

    显示创建新警报规则时“标记”选项卡的屏幕截图。

查看并创建警报规则

执行以下步骤:

  1. “审阅 + 创建 ”选项卡上,验证规则,并告知你任何问题。

  2. 验证通过并查看设置时,选择“ 创建 ”按钮。

    显示创建新警报规则时“查看和创建”选项卡的屏幕截图。

指标警报规则的命名限制

考虑指标警报规则名称的以下限制:

  • 创建指标警报规则名称后,无法更改(重命名)。
  • 指标警报规则名称在资源组中必须是唯一的。
  • 指标警报规则名称不能包含以下字符:* # & + : <> ? @ % { } \ /
  • 指标警报规则名称不能以空格或句点结尾。
  • 组合的资源组名称和警报规则名称不能超过 252 个字符。

注释

如果警报规则名称包含不是字母或数字字符,则某些客户端检索时,这些字符可能是 URL 编码的。 示例包括空格、标点符号和符号。

在具有多个条件的指标警报规则中使用维度时的限制

指标警报支持针对多维指标发出警报,并支持定义多个条件,每个警报规则最多五个条件。

在包含多个条件的警报规则中使用维度时,请考虑以下约束:

  • 每个条件中只能为每个维度选择一个值。

  • 不能使用此选项 来选择所有当前值和将来值。 选择星号 \.

  • 不能在监视多个条件的警报规则中使用动态阈值。

  • 当在不同条件中配置的指标支持同一维度时,必须为相关条件中的所有指标以相同的方式显式设置配置的维度值。

    例如:

    • 请考虑在存储帐户上定义的指标警报规则,并监视两个条件:

      • > 事务总数 5
      • Average SuccessE2ELatency> 250 ms
    • 你想要更新第一个条件,并且只监视 ApiName 维度相等 "GetBlob"的事务。

    • 由于事务SuccessE2ELatency 指标都支持 ApiName 维度,因此需要更新这两个条件,并让它们指定具有"GetBlob"值的 ApiName 维度。

创建包含多个条件的警报规则时的注意事项

  • 每个条件中只能为每个维度选择一个值。
  • 不能将星号 \ 用作维度值。
  • 当在不同条件中配置的指标支持同一维度时,必须为所有这些指标显式设置配置的维度值。 有关资源管理器模板示例,请参阅 使用资源管理器模板创建指标警报

后续步骤