Compartir a través de

使用 Azure Monitor 监视虚拟机:分析监视数据

本文是指南在 Azure Monitor 中监视虚拟机及其工作负荷的一部分。 文中介绍在完成配置后如何分析虚拟机的监视数据。

注意

本方案描述如何实现对 Azure 和混合虚拟机环境的完整监视。 若要开始监视你的第一台 Azure 虚拟机,请参阅监视 Azure 虚拟机

为虚拟机配置数据收集后,就可以使用数据进行分析。 本文介绍 Azure Monitor 的不同功能,你可以使用这些功能来分析虚拟机的运行状况和性能。 其中有些功能可以根据要分析的是单台计算机还是多台计算机来提供不同的体验。 这里通过每项功能的独特行为来介绍每种体验,具体取决于所使用的体验。

单台计算机体验

在每个 Azure 虚拟机和启用 Azure Arc 的服务器上,从 Azure 门户菜单的“监视”部分访问单台计算机分析体验。 这些选项会限制你可以查看的该机算机的数据,或者至少会为此设置一个初始筛选器。 通过这种方式,你可以专注于特定的计算机,查看其当前性能及其在一段时间内的趋势,并帮助确定可能遇到的任何问题。

选项 说明
概述页 选择“监视”选项卡,以显示虚拟机主机的警报、平台指标以及其他监视信息。 可以在选项卡上查看活动警报的数量。在“监视”选项卡中,可以快速查看:

警报:过去 24 小时内触发的警报,以及有关这些警报的一些重要统计信息。 如果没有为此 VM 设置任何警报,有一个链接可帮助你快速为 VM 创建新警报。

关键指标:重要指标在不同时间段的趋势,如 CPU、网络和磁盘。 由于这些是主机指标,因此不包括来宾操作系统中的计数器(如内存)。 选择在指标资源管理器中处理此数据时要使用的图表,你可以在其中执行各种汇总,并添加更多的计数器进行分析。
活动日志 查看为当前虚拟机筛选的活动日志条目。 使用此日志来查看计算机的最近活动,如任何配置更改以及停止和启动时间。
警报 查看当前虚拟机的警报。 这些警报仅将计算机用作目标资源,因此可能存在与之关联的其他警报。 若要查看所有资源的警报,可能需要使用 Azure Monitor 菜单中的“警报”选项。 有关详细信息,请参阅使用 Azure Monitor 监视虚拟机:警报
指标 打开指标资源管理器,并将范围设置为该计算机。 此选项与从“概述”页面选择其中一个性能图表时相同,只不过尚未添加指标。
诊断设置 为当前虚拟机启用和配置诊断扩展。 此选项不同于其他 Azure 资源的“诊断设置”选项。 这是已由 Azure Monitor 代理替换的旧版代理程序
工作簿 打开工作簿库,其中包含用于单台计算机的工作簿。

比较指标和日志

对于 Azure Monitor 的许多功能,你无需了解它使用的各类数据及其存储位置。 你只需关注要分析的逻辑。 深入探索时,你需要了解 Azure Monitor MetricsAzure Monitor Logs 之间的差异。 Azure Monitor 的不同功能会使用不同种类的数据。 用于特定方案的警报类型取决于是否在特定位置提供该数据。

如果你不熟悉 Azure Monitor,这种程度的详细信息可能会造成混淆。 以下信息可帮助你了解数据类型之间的差异:

  • 所有非数值数据(如事件)都存储在日志中。 指标只能包含固定时间间隔的取样数值数据。
  • 数值数据可以同时存储在指标和日志中,以便使用不同的分析方式,并支持不同类型的警报。
  • Azure Monitor 代理将来宾操作系统的性能数据发送到 Metrics 或 Logs。

使用指标资源管理器分析指标数据

使用指标资源管理器,可以绘制图表、直观地关联趋势,并调查指标中的峰值和谷值。 有关如何使用此工具的详细信息,请参阅使用 Azure Monitor 指标资源管理器分析指标

虚拟机使用以下命名空间。

命名空间 说明 要求
虚拟主机 为所有 Azure 虚拟机自动收集的主机指标。 有关详细指标列表,请参阅 Microsoft.Compute/virtualMachines 自动收集,无需任何配置。
虚拟机来宾 Windows 计算机上的来宾操作系统和应用程序性能数据。 安装 Azure Monitor 代理和数据收集规则
azure.vm.linux.guestmetrics Linux 计算机上的来宾操作系统和应用程序性能数据。 安装 Azure Monitor 代理和数据收集规则

使用 Log Analytics 分析日志数据

如果想要更深入地了解用于在工作簿中创建视图的数据,请使用 Log Analytics 对日志数据执行自定义分析。 你可能想要分析这些数据的不同逻辑和聚合,将 Microsoft Defender for Cloud 和 Microsoft Sentinel 收集的安全数据与自己的运行状况和可用性数据相关联。

无需了解如何编写日志查询也能使用 Log Analytics。 你可以选择多个预构建的查询,这些查询无需修改即可运行,也可以用来自定义查询。 在 Log Analytics 屏幕顶部选择“查询”,并查看“资源类型”为“虚拟机”或“虚拟机规模集”的查询。 有关如何使用这些查询的信息,请参阅在 Azure Monitor Log Analytics 中使用查询。 有关如何使用 Log Analytics 运行查询并处理其结果的教程,请参阅 Log Analytics 教程

屏幕截图:显示虚拟机查询。

从计算机的“Logs”菜单启动 Log Analytics 时,其范围设置为该计算机。 任何查询将仅返回与该计算机关联的记录。 对于返回表中的所有记录的简单查询,请双击左窗格中的表。 处理这些结果或修改查询以进行更复杂的分析。 若要将范围设置为工作区中的所有记录,请更改范围或从“Monitor”菜单中选择“Logs”。

屏幕截图:显示表格查询。

通过工作簿实现数据可视化

工作簿在 Azure 门户中提供交互式报表,并将不同类型的数据合并到一个视图中。 工作簿可将文本、日志查询、指标和参数合并到丰富的交互式报告中。 有权访问相同 Azure 资源的其他团队成员都可编辑工作簿。

在如下所述的场景中,工作簿非常有用:

  • 在未提前了解相关指标(例如 CPU 利用率、磁盘空间、内存和网络依赖项)的情况下探索虚拟机的使用情况。 与其他使用情况分析工具不同,工作簿可以结合多个类型的可视化效果和分析,非常适合这种自由探索。
  • 通过显示关键计数器的指标和其他日志事件,向团队解释最近预配的 VM 的性能如何。
  • 与团队的其他成员分享调整 VM 试验规模的结果。 你可以用文本解释试验的目标, 然后显示用于评估试验的每个使用情况指标和分析查询,并提供清晰的标注,说明每个指标是高于还是低于目标。
  • 结合数据、文本说明和后续步骤讨论,报告故障对 VM 使用的影响,从而防止未来发生故障。

后续步骤