使用 Azure 门户为 Azure SQL 托管实例创建警报
适用于:Azure SQL 托管实例
本文说明如何使用 Azure 门户为 Azure SQL 托管实例数据库中的数据库设置警报。 警报可以向你发送电子邮件、调用 web hook、执行 Azure Function、runbook、在某些指标(例如实例存储大小或 CPU 使用率)达到预定义的阈值时发送文本消息。 本文还提供了设置警报期限的最佳做法。
概述
可以根据监控指标或事件接收 Azure 服务的警报。
- 指标值 - 当指定指标的值在任一方向越过了指定的阈值时警报将触发。 也就是说,当条件先是满足以及之后不再满足该条件时,警报都会触发。
可以配置警报以在其触发时执行以下操作:
- 向服务管理员和共同管理员发送电子邮件通知
- 将电子邮件发送到指定的其他电子邮件地址。
- 向组发送电话号码
- 调用 Webhook
- 调用 Azure Function
- 调用 Azure runbook
可以使用 Azure 门户、PowerShell 或 Azure CLI 或者 Azure Monitor REST API 来配置和获取警报规则的相关信息。
适用于托管实例的警报指标
重要
警报指标仅适用于托管实例。 警报指标不适用于托管实例中的单个数据库。 另一方面,数据库诊断遥测可按诊断日志的形式提供。
以下托管实例指标可用于警报配置:
指标 | 说明 | 度量单位 \ 可能值 |
---|---|---|
CPU 平均百分比 | 选定时间段内 CPU 使用率的平均百分比。 | 0-100(百分比) |
已读取的 IO 字节数 | 选定时间段内已读取的 IO 字节数。 | 字节 |
已写入的 IO 字节数 | 选定时间段内已写入的 IO 字节。 | 字节 |
IO 请求计数 | 选定时间段内的 IO 请求计数。 | 数值 |
预留的存储空间 | 当前为托管实例预留的最大存储空间。 随资源缩放操作所发生的变化。 | MB(兆字节) |
已使用的存储空间 | 选定时间段内已使用的存储空间。 随数据库和实例的存储消耗所发生的变化。 | MB(兆字节) |
虚拟核心计数 | 为托管实例预配的 vCore 数量。 随资源缩放操作所发生的变化。 | 4-80 (vCore) |
使用 Azure 门户创建指标的警报规则
在 Azure 门户中,查找想要监视的托管实例,并选择该实例。
在监视部分中选择“指标”菜单项。
在“指标”下拉菜单上,选择要设置警报的指标之一(示例中显示了已使用的存储空间)。
使用“聚合”选择聚合时间段 - 在给定时间段内达到的平均值、最小值或最大值(Avg、Min 或 Max)。
选择“新建警报规则”。
在“警报逻辑”部分中:
字段 说明 阈值 选择是否应根据静态值或动态值评估阈值。
静态阈值使用配置的阈值评估规则。
动态阈值使用机器学习算法持续了解指标行为模式并自动计算阈值。 可以详细了解如何对指标警报使用动态阈值。聚合类型 聚合类型选项有“最小值”、“最大值”或“平均值”(在聚合粒度期间内) 运算符 选择用于将指标值与阈值进行比较的运算符。 计价单位 如果所选指标信号支持不同的单位(例如字节、KB、MB 和 GB),并且如果选择了“静态”阈值,请输入条件逻辑的单位。 阈值 如果选择了“静态”阈值,请输入条件逻辑的阈值。 阈值是根据运算符和聚合条件计算的警报值。 阈值敏感度 如果选择了“动态”阈值,请输入敏感度级别。 敏感度级别会影响触发警报所需的指标系列模式偏差量。 聚合粒度 选择用于使用聚合类型函数对数据点进行分组的间隔。 选择大于“评估频率”的“聚合粒度”(周期),以降低错过对已添加的时序进行首次评估的可能性。 评估频率 选择警报规则的运行频率。 选择小于聚合粒度的频率,以生成用于评估的滑动窗口。 在“何时评估”部分:
字段 说明 检查间隔 选择警报规则检查条件是否满足的频率。 回溯期间 选择回溯期,即每次检查数据时要回溯的时间段。 例如,每隔 1 分钟查看过去的 5 分钟。 在屏幕截图所示的示例中,值 1840876 MB 表示阈值为 1.8 TB。 由于示例中的操作符设置为“大于”,所以如果托管实例上的存储空间消耗量超过 1.8 TB,就会创建警报。 请注意,存储空间指标的阈值必须以 MB 表示。
选择页面底部的“下一步: 操作>”或“操作”选项卡。
在“操作”选项卡中,选择或创建所需的操作组。 此操作定义在触发警报时发生的操作(例如发送电子邮件或在你的电话上呼叫)。 如果需要创建新的操作组:
选择“+ 创建操作组”。
输入操作组名称和显示名称,然后选择“区域”:
选项 行为 全球 操作组服务决定操作组的存储位置。 操作组至少保留在两个区域中,以确保区域复原能力。 可以在任何地理区域中处理操作。
因服务健康状况警报而执行的语音、短信和电子邮件操作在出现 Azure 实时站点事件时可复原。选择页面底部的“下一步: 通知>”或“通知”选项卡。
在“通知”选项卡中,定义触发警报时要发送的通知。
通知类型:选择“电子邮件 Azure 资源管理器角色”,向分配了特定订阅级别的 Azure 资源管理器角色的用户发送电子邮件,或选择“电子邮件/短信”向特定收件人发送各种通知类型。
名称:输入通知的唯一名称。
详细信息:根据所选的通知类型,输入电子邮件地址、电话号码或其他信息。
常见警报架构:可以选择启用常见警报架构,获得单个可扩展的统一警报有效负载跨 Monitor 中的所有警报服务的优势。 有关此架构的详细信息,请参阅常见警报架构。
如果需要定义在触发警报时要触发的操作列表,请选择“操作”选项卡,并在兼容系统中定义执行 Webhook、Azure 函数或 Runbook 等操作。
如果要将键值对分配给操作组,请选择“标记”选项卡。否则,请跳过此步骤。 通过使用标记,可以对 Azure 资源进行分类。 标记适用于所有 Azure 资源、资源组和订阅。
要查看设置,请选择“查看 + 创建”选项卡。此步骤会快速检查输入,以确保已输入所有必需信息。 如果有问题,将在此处报告。 查看设置后,选择“创建”以创建操作组。
在“详细信息”选项卡中,填写用于记录的警报规则详细信息和设置,然后选择严重性类型。
在“标记”选项卡中,在预警规则资源上设置任何必需的标记。 否则,请跳过此步骤。
在“审核 + 创建”选项卡中,将运行验证并告知所有问题。 通过验证并查看设置后,选择页面底部的“创建”按钮。
新的警报规则将在几分钟内激活,并根据设置触发。
验证警报
注意
若要抑制干扰警报,请参阅使用操作规则抑制警报。
设置警报规则后,请验证警报触发情况及其频率是否符合需求。 对于此页上显示的关于针对已使用的存储空间设置警报的示例,如果警报选项是电子邮件,则可能会收到电子邮件,如下所示。
电子邮件显示警报名称、阈值的详细信息以及触发警报的原因,可帮助你验证警报并对警报进行故障排除。
- 选择“在 Azure 门户中查看”按钮,以在 Azure 门户中查看通过电子邮件收到的警报。
- 选择“查看规则 >”以查看或编辑触发警报的警报规则。
- 选择“查看资源 >”以查看触发警报的托管实例。
查看、暂停、激活、修改和删除现有警报规则
注意
需要通过 Azure 门户仪表板的“警报”菜单管理现有警报。 无法从托管实例资源窗格修改现有警报。
若要查看、暂停、激活、修改和删除现有警报:
使用 Azure 门户搜索搜索警报。 单击“警报”。
或者,也可以单击 Azure 导航栏上的警报(如果已配置)。
在“警报”窗格中,选择“警报规则”。
随即显示现有警报的列表。 选择单个现有警报规则进行管理。 可以根据你的偏好修改和调整现有的活动规则。 也可以不删除活动规则而是将其挂起。
后续步骤
- 了解 Azure Monitor 警报系统的详细信息,请参阅 Microsoft Azure 中的警报概述
- 了解有关指标警报的详细信息,请参阅了解指标警报在 Azure Monitor 中的工作原理
- 了解如何在警报中配置 webhook 的详细信息,请参阅使用经典指标警报调用 webhook
- 了解如何使用 PowerShell 配置和管理警报,请参阅操作规则
- 了解如何使用 API 配置和管理警报,请参阅 Azure Monitor REST API 参考