Azure Monitor 指标概述

Azure Monitor 指标是 Azure Monitor 的一项功能,它将受监视的资源中的数值数据收集到时序数据库。 指标是定期收集的数值,用于描述系统在某一特定时间的某些情况。 Azure Monitor 中的指标是轻型数据,能够支持准实时方案,这让其在发出警报和快速检测问题方面特别有用。 您可以使用指标资源管理器以交互方式分析它们,在值超过阈值时主动收到通知警报,或者在工作簿或仪表板中将其可视化。

备注

Azure Monitor 指标是支持 Azure Monitor 的数据平台的一半。 另一半是 Azure Monitor 日志它收集和组织日志和性能数据,并允许使用丰富的查询语言进行分析。 指标比 Azure Monitor 日志中的数据更为轻量,并且能够支持准实时方案,因此特别适用于对问题发出警报并快速进行检测。 不过,指标只能将数值数据存储在特定的结构中,而日志可以存储各种不同的数据类型,每个数据类型都有自己的结构。 还可使用日志查询对日志数据执行复杂的分析,只是无法分析指标数据。

Azure Monitor 指标有何用途?

下表列出了在 Azure Monitor 中指标的不同使用方式。

说明
分析 使用指标资源管理器分析图表上收集的指标,并比较来自不同资源的指标。
Alert 配置指标警报规则,以在指标值超过阈值时发送通知或执行自动化操作
可视化 将指标资源管理器中的图表固定到 Azure 仪表板
创建工作簿,以与交互式报表中的多组数据合并。将查询结果导出到 Grafana,以利用它的仪表板,并与其他数据源合并。
自动化 使用自动缩放并根据超过阈值的指标值来增加或减少资源。
检索 使用 PowerShell cmdlet 通过命令行来访问指标值
使用 REST API 通过自定义应用来访问指标值。
使用 CLI 通过命令行来访问指标值。
导出 将指标路由到日志,以将 Azure Monitor 指标中的数据与 Azure Monitor 日志中的数据一起进行分析,并将指标值存储超过 93 天。
将指标流式传输到事件中心,以路由到外部系统。
存档 出于符合性、审核或脱机报告目的,对资源的性能或运行状况历史记录进行 存档

指标概述

数据收集

Azure Monitor 从三个基本源收集指标。 只要在 Azure Monitor 指标数据库中收集了这些指标,就可以一起评估它们,而不管它们的数据源是什么。

Azure 资源。 平台指标由 Azure 资源创建,可用于洞察这些资源的运行状况和性能。 每种资源创建一组非重复性指标,无需进行任何配置。 平台指标每分钟从 Azure 资源中收集一次,除非在指标的定义中另有规定。

应用程序。 指标由 Application Insights 为受监视的应用程序创建,可帮助检测性能问题,以及跟踪应用程序的用法趋势。 此类指标包括“服务器响应时间”和“浏览器异常”等值。

虚拟机代理。 指标从虚拟机的来宾操作系统收集。 使用 Windows 诊断扩展 (WAD) 为 Windows 虚拟机启用来宾 OS 指标,并使用 InfluxData Telegraf 代理为 Linux 虚拟机启用来宾 OS 指标。

指标资源管理器

使用指标资源管理器以交互方式分析指标数据库中的数据,并绘制随时间变化的多个指标的值图表。 可以将图表固定到仪表板,以便使用其他可视化效果来查看它们。 还可以使用 Azure 监视 REST API 检索指标。

指标资源管理器

数据结构

Azure Monitor 指标收集的数据存储在更适合分析带有时间戳的数据的时序数据库中。 每组指标值都是具有以下属性的时序:

  • 值的收集时间
  • 与值关联的资源
  • 充当指标类别的命名空间
  • 指标名称
  • 值本身
  • 一些指标可能会有多个维度,如多维指标中所述。 自定义指标最多可以包含 10 个维度。

多维指标

指标数据面临的一大挑战是,通常只有有限的信息来为收集的值提供上下文。 Azure Monitor 通过多维指标解决了这一挑战。 指标维度是携带附加数据来描述指标值的名称/值对。 例如,指标“可用磁盘空间”可能有名为“驱动器”且值为“C:”和“D:”的维度,此维度可便于查看所有驱动器的可用磁盘空间,也可便于单独查看每个驱动器的可用磁盘空间。

以下示例演示了名为“网络吞吐量”的假设指标的两个数据集。 第一个数据集不包含维度。 第二个数据集使用两个维度(IP 地址方向)显示值:

网络吞吐量

时间戳 指标值
8/9/2017 8:14 1,331.8 Kbps
8/9/2017 8:15 1,141.4 Kbps
8/9/2017 8:16 1,110.2 Kbps

上述不包含维度的指标只能够回答类似“在某个给定时间我的网络吞吐量是多少?”的基本问题

网络吞吐量 + 两个维度(“IP 地址”和“方向”)

时间戳 “IP”维度 “方向”维度 指标值
8/9/2017 8:14 IP="192.168.5.2" Direction="Send" 646.5 Kbps
8/9/2017 8:14 IP="192.168.5.2" Direction="Receive" 420.1 Kbps
8/9/2017 8:14 IP="10.24.2.15" Direction="Send" 150.0 Kbps
8/9/2017 8:14 IP="10.24.2.15" Direction="Receive" 115.2 Kbps
8/9/2017 8:15 IP="192.168.5.2" Direction="Send" 515.2 Kbps
8/9/2017 8:15 IP="192.168.5.2" Direction="Receive" 371.1 Kbps
8/9/2017 8:15 IP="10.24.2.15" Direction="Send" 155.0 Kbps
8/9/2017 8:15 IP="10.24.2.15" Direction="Receive" 100.1 Kbps

此指标可以回答类似“每个 IP 地址的网络吞吐量是多少?”,以及“相对于收到的数据,发送的数据有多少?”的问题 与不包含维度的指标相比,多维指标具有更多分析值和诊断值。

指标保留期

对于 Azure 中的大多数资源,平台指标将存储 93 天。 有一些例外情况:

来宾 OS 指标

  • 经典来宾 OS 指标 - 14 天,有时更多。 这些性能计数器由 Windows 诊断扩展 (WAD)Linux 诊断扩展 (LAD) 收集,并路由到 Azure 存储帐户。 保证这些指标的保留期至少为 14 天,但不会将实际的到期日期写入存储帐户。 出于性能原因,门户会根据卷限制显示的数据量。 因此,如果写入的数据量不太大,则门户检索到的实际天数可能会超过 14 天。
  • 发送到 Azure Monitor 指标的来宾 OS 指标 - 93 天。 这些是由 Windows 诊断扩展 (WAD) 收集并发送到 Azure Monitor 数据接收器的性能计数器,或是通过 Linux 计算机上的 InfluxData Telegraf 代理收集的性能计数器。 这些指标的保留期为 93 天。
  • Log Analytics 代理收集的来宾 OS 指标 - 31 天至 2 年。 这些性能计数器由 Log Analytics 代理收集,并发送到 Log Analytics 工作区。 这些指标的保留期为 31 天,最多可延长到 2 年。

基于 Application Insights 日志的指标。 多种多样。 - 在后台,基于日志的指标将转换为日志查询。 其保留期与基础日志中事件的保留期相匹配(31 天至 2 年)。 对于 Application Insights 资源,日志的存储时间为 90 天。

备注

如上所述,对于 Azure 中的大多数资源,平台指标存储 93 天。 但是,你只能在任何单个图表的“指标”磁贴中查询不超过 30 天的数据。 此限制不适用于基于日志的指标。 如果你看到空白图表或者图表仅显示一部分指标数据,请验证时间选取器中的开始日期与结束日期之差是否不超过 30 天。 选择 30 天间隔后,你可以平移图表以查看完整的保留期。

后续步骤