容器见解报表

对于 Azure 工作簿,建议使用容器见解中的现成报表。 本文介绍了可用的各种工作簿以及如何访问这些工作簿。

查看工作簿

在 Azure 门户上的 Azure Monitor 菜单中,选择“容器”。 在“监视”部分,选择“见解”,选择一个特定的群集,然后选择“报表”选项卡。可以在 Azure Monitor 的工作簿库查看。

Screenshot that shows the Reports page.

群集优化工作簿

群集优化工作簿提供了多个分析器,可让你快速查看 Kubernetes 群集的运行状况和性能。 它具有多个分析器,每个分析器提供与群集相关的各种信息。 在群集上启用容器见解后,工作簿无需进行配置。

运行情况探测失败数

运行情况探测失败分析器显示最近失败的运行情况探测以及失败频率。 选择其中一个来查看发生时序。 此分析器包含以下列:

  • 总数:统计整个时间范围内的运行情况探测失败次数
  • 控制器总数:统计控制器管理的所有容器的运行情况探测失败次数

Screenshot of Cluster Optimization Workbook.

事件异常

“事件异常”分析器将类似事件组合在一起,用于简化分析。 它还显示了最近哪些事件组的数量增加了。 列表中的事件根据常见短语进行分组。 例如,消息为“pod-abc-123 失败,无法拉取映像”和“pod-def-456 失败,无法拉取映像”的两个事件将归为一组。 Spikiness 列为最近发生的事件概率评级。 例如,如果事件 A 和 B 在上个月平均每天发生 10 次,但事件 A 在昨天发生了 1000 次,而事件 B 在昨天发生了 2 次,那么事件 A 的峰值评级将比 B 高得多。

Screenshot of event anomaly analyzer in Cluster Optimization Workbook.

容器优化器

“容器优化器”分析器显示 CPU 过高以及包含内存限制和请求的容器。 每个磁贴可以表示具有相同规格的多个容器。例如,如果部署创建 100 个相同的 Pod,每个 Pod 都有一个容器 C1 和 C2,则所有 C1 容器对应一个磁贴,所有 C2 容器对应一个磁贴。 具有设置限制和请求的容器用颜色编码(从绿色到红色的颜色渐变)。

重要

此视图不包括 kube-system 命名空间中的容器,不支持 Windows Server 节点。

每个磁贴上的数字表示容器限制/请求与最佳/建议值的距离。 数字越接近 0 越好。 每个磁贴都用一种颜色来指示以下内容:

  • 绿色:限制和请求设置良好
  • 红色:限制或请求过多
  • 灰色:限制或请求未设置

Screenshot of container optimizer analyzer in the Cluster Optimization Workbook.

节点监视工作簿

  • 磁盘容量:每个磁盘的交互式磁盘使用情况图表通过以下视角呈现给容器中的节点:

    • 所有磁盘的磁盘使用率百分比。
    • 所有磁盘的可用磁盘空间。
    • 一个网格,显示每个节点磁盘的已使用空间百分比、已使用空间趋势百分比、可用磁盘空间 (GiB),以及可用磁盘空间趋势 (GiB)。 选择表中的某个行时,会在该行下面显示已使用空间百分比和可用磁盘空间 (GiB)。
  • 磁盘 IO:呈现给容器内节点的每个磁盘的交互式磁盘利用率图表,包含以下方面的内容:

    • 跨所有磁盘按读取字节数/秒、写入字节数/秒以及读取和写入字节数/秒趋势汇总的磁盘 I/O。
    • 八个显示关键性能指标的性能图表,用于度量和标识磁盘 I/O 瓶颈。
  • GPU:每个 GPU 感知 Kubernetes 群集节点的交互式 GPU 使用情况图表。

注意

根据 Kubernetes 上游公告,GPU 指标收集将立即禁用。 有关如何继续收集 GPU 指标的说明,请参阅使用容器见解配置 GPU 监视

  • 子网 IP 使用情况:从以下角度查看群集中每个节点的交互式 IP 使用情况图表:

    • 从子网分配的 IP。
    • 分配给 Pod 的 IP。

注意

默认情况下,从子网向每个节点分配 16 个 IP。 不能将其修改为小于 16。 有关如何启用子网 IP 使用指标的说明,请参阅监视 IP 子网使用情况

资源监视工作簿

  • 部署:部署状态和 Pod 水平自动伸缩 (HPA),包括自定义 HPA。

  • 工作负载详细信息:显示某个命名空间工作负载性能统计数据的交互式图表。 包括以下多个选项卡:

    • Pod 的 CPU 和内存使用情况“概述”。
    • 显示 Pod 重启趋势、容器重启趋势以及 Pod 的容器状态的“POD/容器状态”。
    • 显示控制器事件摘要的“Kubernetes 事件”。
  • Kubelet:包括两个显示关键节点操作统计信息的网格:

    • 节点网格的概览汇总了每个节点的总操作数、总错误数、成功的操作数(按百分比),以及趋势。
    • 操作类型概览汇总了每个操作的总操作数、总错误数、成功的操作数(按百分比),以及趋势。

计费工作簿

  • 数据使用情况:帮助你直观显示数据源,而不必根据我们在文档中分享的内容构建自己的查询库。 在此工作簿中,可以查看显示计费数据的图表,例如:

    • 按解决方案引入的总计费数据(以 GB 为单位)。
    • 按容器日志(应用程序日志)引入的计费数据。
    • 按“Kubernetes 命名空间”查看引入的计费容器日志数据。
    • 按群集名查看引入并分隔的计费容器日志数据。
    • 按日志源条目引入的计费容器日志数据。
    • 按诊断主节点日志引入的计费诊断数据。

网络工作簿

  • NPM 配置:监视通过网络策略管理器 (npm) 为以下配置的网络配置:

    • 有关总体配置复杂程度的摘要信息。
    • 一段时间内的策略、规则和设置计数,让你可以深入了解这三者之间的关系,并添加一个时间维度,以便对配置进行调试。
    • 所有 IPSet 和每个 IPSet 中的条目数。
    • 用于将组件添加到网络配置的每个节点的最差和平均用例性能。
  • 网络:每个节点的网络适配器的交互式网络利用率图表。 网格显示了关键性能指标,有助于测量网络适配器的性能。

创建自定义工作簿

要基于这些工作簿中的任何一个创建自定义工作簿,请选择“查看工作簿”下拉列表,然后选择列表底部的“转到 AKS 库”。 有关工作簿以及如何使用工作簿模板的详细信息,请参阅 Azure Monitor 工作簿

Screenshot that shows the AKS gallery.

后续步骤

有关 Azure Monitor 中工作簿的详细信息,请参阅 Azure Monitor 工作簿