Azure Monitor 中的指标资源管理器的高级功能

在 Azure Monitor 中,指标是随着时间的推移收集和存储的一系列度量值和计数。 指标可以是标准(也称为“平台”)指标,也可以是自定义指标。

Azure 平台提供标准指标。 这些指标反映 Azure 资源的运行状况和使用情况统计信息。

本文介绍 Azure Monitor 中的指标资源管理器的高级功能。 本文假定使用者熟悉指标资源管理器的基本功能。 如果你是新用户,希望了解如何创建第一个指标图表,请参阅指标资源管理器入门

资源范围选取器

使用资源范围选取器,可查看单个资源和多个资源的指标。

选择单个资源

  1. 在 Azure 门户中,从“监视”菜单或从资源菜单的“监视”部分选择“指标”。

  2. 选择“选择范围”。

    Screenshot that shows the button that opens the resource scope picker.

  3. 使用范围选取器选择要查看其指标的资源。 如果你从资源菜单打开了指标资源管理器,则应已填充了范围。

    对于某些资源,一次只能查看一个资源的指标。 在“资源类型”菜单中,这些资源位于“所有资源类型”部分。

    Screenshot that shows available resources.

  4. 选择资源。 将显示包含该资源的所有订阅和资源组。

    Screenshot that shows a single resource.

    如果需要同时查看多个资源的指标的功能,或查看整个订阅或资源组的指标的功能,请选择“投票赞成”。

  5. 选好之后,请选择“应用”。

选择多个资源

某些资源类型可以查询多个资源的指标。 这些资源必须位于相同的订阅和位置中。 可以在“资源类型”菜单顶部找到这些资源类型。

Screenshot that shows cross-resource types.

对于兼容多个资源的类型,你可以查询跨订阅或跨多个资源组的指标。

多个指标行和图表

在指标资源管理器中,可以创建绘制多个指标行的图表或同时显示多个指标图表。 此功能用于:

  • 将同一个图中的相关指标关联到一起,了解一个值如何与另一个值相关联。
  • 以邻近的方式显示使用不同度量单位的指标。
  • 直观地聚合和比较来自多个资源的指标。

例如,假设你有 5 个存储帐户,想知道它们一起使用了多少空间。 你可以创建一个堆积面积图表,以显示不同时间点的各个值以及所有值的总和。

同一图表上的多个指标

若要在同一个图表中查看多个指标,请首先创建新的图表。 然后选择“添加指标”。 通过同样的步骤在同一图表上添加另一指标。

Screenshot that shows multiple metrics.

通常,图表不应混合那些使用不同度量单位的指标。 例如,应避免将一个使用毫秒的指标与另一个使用千字节的指标混合使用。 还应避免混合使用尺度差别很大的指标。 在这些情况下,请考虑改用多个图表。

多个图表

若要使用另一指标创建另一图表,请选择“新建图表”。

若要对多个图表重新排序或将其删除,请选择省略号 ( ... ) 按钮以打开图表菜单。 然后,选择“上移”、“下移”或“删除”。

Screenshot that shows multiple charts.

时间范围控件

除了使用时间选取器面板来更改时间范围外,还可以使用图表区域中的控件进行平移和缩放。

平移

若要平移,请选择图表边缘的向左和向右箭头。 箭头控件会将选定的时间范围前后移动图表的时间跨度的一半。 例如,如果你正在查看过去 24 小时,选择向左箭头会导致时间范围转换为一天半至 12 小时前。

大多数指标支持 93 天的保留期,但一次只能查看 30 天。 使用平移控件,可以查看过去 30 天的内容,并可以一次轻松后退 15 天,以查看保留期的剩余部分。

Animated screenshot that shows left and right pan controls.

Zoom

可以在图表上选择并拖动以放大图表中的某个部分。 缩放操作将按照你选择的范围更新图表的时间范围。 如果将时间粒度设置为“自动”,则缩放操作将选择较小的时间粒度。 新时间范围将应用于指标资源管理器中的所有图表。

Animated screenshot that shows the zoom feature in Metrics Explorer.

聚合

将指标添加到图表时,指标资源管理器将应用默认聚合。 默认值在基本方案中适用,但可以使用不同的聚合来获得有关指标的更多见解。

在图表上使用不同的聚合之前,应了解指标资源管理器处理它们的方式。 指标是在一段时间内捕获的一系列度量(或“指标值”)。 绘制图表时,所选指标的值将基于时间粒度进行单独聚合。

请使用指标资源管理器中的时间选取器面板选择时间粒度的大小。 如果没有显式选择时间粒度,则指标资源管理器默认使用当前选择的时间范围。 指标资源管理器确定时间粒度后,在每个时间粒度期间捕获的指标值会聚合在图表上,每个时间粒度一个数据点。

例如,假设图表显示“服务器响应时间”指标。 它针对过去 24 小时的时间跨度使用平均值聚合。

Screenshot that shows the time range and granularity selector.

在此示例中:

  • 如果将时间粒度设置为 30 分钟,则指标资源管理器基于 48 个聚合数据点绘制图表。 也就是说,它使用每小时两个数据点,持续 24 小时。 折线图在图表绘图区域中连接 48 个点。 每个数据点表示在每个相关的 30 分钟时间段内发生的服务器请求的所有捕获响应时间的平均值。
  • 如果将时间粒度切换成 15 分钟,你将获得 96 个聚合数据点。 也就是说,在 24 小时内,每小时可获得 4 个数据点。

指标资源管理器有五种聚合类型:

  • 总和:在聚合间隔期间捕获的所有值的总和。 总和聚合有时称为“总计”聚合。

  • 计数:在聚合间隔期间捕获的度量数。

    当捕获的指标的值始终为 1 时,计数聚合等于总和聚合。 当指标跟踪不同事件的计数,并且每个度量表示一个事件时,这种情况很常见。 每当一个新请求到达时,代码都会发出一个指标记录。

  • Average:在聚合间隔期间捕获的指标值的平均值。

  • 最小值:在聚合间隔期间捕获的最小值。

  • 最大值:在聚合间隔期间捕获的最大值。

Screenshot that shows the aggregation dropdown list.

指标资源管理器会隐藏不相关且无法使用的聚合。

有关指标聚合工作原理的深入讨论,请参阅 Azure Monitor 指标聚合和显示说明

筛选器

可以将筛选器应用到其指标有多个维度的图表。 例如,假设有一个具有“响应类型”维度的“事务计数”指标。 此维度指示来自事务的响应成功了还是失败了。 如果在此维度上进行筛选,指标资源管理器会显示只绘制成功或失败事务的图表线条。

添加筛选器

  1. 在图表上方选择“添加筛选器”。

  2. 从“属性”下拉列表中选择一个维度。

    Screenshot that shows the dropdown list for filter properties.

  3. 选择要对维度(属性)应用的运算符。 默认运算符为“等于” (=)。

    Screenshot that shows the operator that you can use with the filter.

  4. 选择在绘制图表时要应用于筛选器的维度值。 此示例显示了筛选出成功的存储事务。

    Screenshot that shows the dropdown list for filter values.

  5. 选择筛选器值后,在筛选器选择器外部单击以将其关闭。 图表显示失败的存储事务数。

    Screenshot that shows the successful filtered storage transactions.

  6. 重复这些步骤,以将多个筛选器应用于相同的图表。

指标拆分

可以按维度拆分指标,将指标的不同部分进行直观比较。 拆分还有助于标识某个维度的无关段。

应用拆分

  1. 在图表上方选择“应用拆分”。

  2. 选择要用于细分图表的维度。

    Screenshot that shows the selected dimension on which to segment the chart.

    图表显示多个线条,每个维度部分均有一个。

    Screenshot that shows multiple lines, one for each segment of dimension.

  3. 选择在按选定维度拆分后要显示的值数限制。 默认限制为 10,如上图所示。 限制范围为 1-50。

    Screenshot that shows the split limit, which restricts the number of values after splitting.

  4. 选择段的排序顺序:“降序”(默认值)或“升序”。

    Screenshot that shows the sort order on split values.

  5. 通过从“值”下拉列表中选择多个维度,按多个段进行细分。 图例显示每个段的维度值的逗号分隔列表。

    Screenshot that shows multiple segments selected, and the corresponding chart.

  6. 在分组选择器之外单击以将其关闭。

提示

若要隐藏与你的方案无关的部分,使图表更易于读取,请在同一个维度上同时使用筛选和拆分。

锁定 y 轴的范围

在大值出现小波动的图表中,锁定值轴(y 轴)的范围变得很重要。

例如,如果成功请求的比例从 99.99% 降到 99.5%,则可能表示服务质量显著降低。 如果使用默认的图表设置,则观察小的数值波动会很困难,甚至不可能实现。 在这种情况下,你可以将图表的最低边界锁定为 99%,使较小的降低幅度变得更明显。

另一个示例是可用内存的波动。 从技术上讲,这种情况下的值永远不会达到 0。 将范围固定为一个较高的值可以使可用内存的降低更容易被发现。

控制 y 轴范围:

  1. 通过选择省略号 (...) 打开图表菜单。然后,选择“图表设置”以访问高级图表设置。

    Screenshot that shows the menu option for chart settings.

  2. 修改“Y 轴范围”部分的值,或者选择“自动”恢复为默认值。

    Screenshot that shows the Y-axis range section.

如果锁定在一段时间内跟踪计数、总和、最小值或最大值聚合的图表的 y 轴边界,请指定固定的时间粒度。 不要依赖于自动默认值。

之所以选择固定的时间粒度,是因为当用户通过重设浏览器窗口大小或更改屏幕分辨率来自动修改时间粒度时,图表值会发生更改。 时间粒度发生的更改会影响图表的外观,导致选择的 y 轴范围失效。

线条颜色

将从默认调色板自动为图表线条分配颜色。

若要更改图表线条的颜色,请选择与图表上的线条对应的图例中的彩色条。 使用颜色选取器选择行颜色。

Screenshot that shows the color picker.

将图表固定到仪表板时,会保留自定义颜色。 以下部分说明如何固定图表。

保存到仪表板或工作簿

配置图表后,可以将其添加到仪表板或工作簿。 图表添加到仪表板或工作簿后即可供团队访问。 还可以通过在其他监视信息的上下文中查看它来获得见解。

  • 若要将配置的图表固定到仪表板,请在图表的右上角选择“保存到仪表板”>“固定到仪表板”。
  • 若要将配置的图表保存到工作簿,请在图表的右上角选择“保存到仪表板”>“保存到工作簿”。

Screenshot that shows menu options for adding a chart to a dashboard or workbook.

警报规则

可以使用可视化条件来创建基于指标的警报规则。 新的警报规则包括图表的目标资源、指标、拆分和筛选器维度。 可以使用“创建警报规则”窗格修改这些设置。

创建警报规则:

  1. 选择“警报”右上角的“新建警报规则”。

    Screenshot that shows the button for creating a new alert rule.

  2. 选择“条件”选项卡。“信号名称”条目默认为图表中的指标。 可以选择其他指标。

  3. 为“阈值”输入一个数字。 阈值是触发警报的值。 “预览”图表将阈值显示为指标值上方的水平线。 准备就绪后,选择“详细信息”选项卡。

    Screenshot that shows the Condition tab on the pane for creating an alert rule.

  4. 输入警报规则的“名称”和“说明”值。

  5. 选择警报规则的严重性级别。 严重性包括“严重”、“错误警告”、“信息性”和“详细”。

  6. 选择“查看 + 创建”以查看警报规则。

    Screenshot that shows the Details tab on the pane for creating an alert rule.

  7. 选择“创建”以创建警报规则。

有关详细信息,请参阅创建、查看和管理指标警报

将指标关联到日志

在指标资源管理器中,“深入查看日志”有助于诊断指标图表中异常的根本原因。 使用“深入查看日志”,可将指标图表中的峰值与以下类型的日志和查询关联:

术语 定义
活动日志 了解从外部(管理平台)对订阅中的每个 Azure 资源执行的操作,以及对 Azure 服务运行状况事件进行的更新。 通过活动日志,可确定对订阅中资源进行的任何写入操作(PUTPOSTDELETE)的操作内容、操作人员和操作时间等信息。 每个 Azure 订阅都具有单个活动日志。
诊断日志 针对在 Azure 资源(数据平面)中执行的操作提供见解。 示例包括从密钥保管库获取机密或向数据库发出请求。 资源日志的内容因 Azure 服务和资源类型而异。 必须为资源启用日志。
建议的日志 提供基于场景的查询,你可以在指标资源管理器中使用这些查询来调查异常情况。

目前,“深入查看日志”适用于选定的资源提供程序。 以下资源提供程序提供完整的“深入查看日志”体验:

  • Application Insights
  • 自动缩放
  • Azure 应用服务
  • Azure 存储

诊断失败请求的峰值:

  1. 选择“深入查看日志”。

    Screenshot that shows a spike in failures on an Application Insights metrics pane.

  2. 在下拉列表中,选择“失败”。

    Screenshot that shows the dropdown menu for drilling into logs.

  3. 在自定义失败窗格中,检查失败的操作、常见异常类型和失败的依赖项。

    Screenshot of the Application Insights failure pane.

后续步骤

若要使用指标创建可操作的仪表板,请参阅创建自定义 KPI 仪表板