实时查看指标
借助容器见解实时数据,可以实时可视化群集中有关节点和 Pod 状态的指标。 该功能模拟对 kubectl top nodes
、kubectl get pods --all-namespaces
和 kubectl get nodes
命令的直接访问,以调用、分析和可视化此见解中包含的性能图表中的数据。
本文详细介绍了此功能,并帮助你了解如何使用此功能。
注意
此功能不支持启用为专用群集的 Azure Kubernetes 服务 (AKS) 群集。 此功能依赖于从浏览器通过代理服务器直接访问 Kubernetes API。 启用网络安全以阻止来自此代理的 Kubernetes API 阻止此流量。
如需获取设置实时数据功能或对其进行故障排除的帮助,请参阅设置指南。
工作原理
实时数据功能可直接访问 Kubernetes API。 有关身份验证模型的详细信息,请参阅 Kubernetes API。
此功能对指标终结点(包括 /api/v1/nodes
、/apis/metrics.k8s.io/v1beta1/nodes
和 /api/v1/pods
)执行轮询操作。 默认情况下,轮询间隔为 5 秒。 通过对“实时”复选框选择“开”,将这些数据缓存在你的浏览器中,并绘制在“群集”选项卡上“容器见解”中包含的四个性能图表中。 每个后续轮询都将绘制到一个滚动显示五分钟的可视化窗口中。
从“设置间隔”下拉列表中配置轮询间隔。 使用此下拉列表可将新数据的轮询间隔设置为 1、5、15 和 30 秒。
重要
如果你想要在短时间内排查问题,我们建议将轮询间隔设置为 1 秒。 这些请求可能会影响群集上 Kubernetes API 的可用性和限制。 然后,重新配置为更长的轮询间隔。
无法将这些图表固定到在实时模式下查看的最后一个 Azure 仪表板。
重要
此功能运行期间不会永久存储任何数据。 当你关闭浏览器或退出此功能时,在此会话期间捕获的所有信息将立即删除。 数据只会在 5 分钟时限内呈现以提供可视化效果。 超过 5 分钟的任何指标也将被永久删除。
指标捕获
将捕获以下指标并显示在四个性能图表中。
节点 CPU 利用率百分比和节点内存利用率百分比
这两个性能图表分别对应于调用 kubectl top nodes
并将 CPU% 和 MEMORY% 列的结果捕获到相应的图表 。
百分位数计算在较大的群集中很有用,可帮助识别群集中的异常节点。 例如,可以了解节点是否未充分利用,以便纵向缩减。 使用“最小值”聚合可以查看群集中哪些节点的利用率较低。 若要进一步调查,请选择“节点”选项卡,并按 CPU 或内存利用率对网格进行排序。
此信息还有助于了解哪些节点即将到达限制以及是否需要横向扩展。 同时使用“最大值”和“P95”聚合可以查看群集中是否存在具有高资源利用率的节点。 为了进一步调查,你将再次切换到“节点”选项卡。
节点计数
此性能图表对应于 kubectl get nodes
并将“状态”列映射到按状态类型分组的图表。
节点将报告为“就绪”或“未就绪”状态,并且会统计它们以创建总计数。 这两个聚合的结果将绘制成图表,例如,你可以从中了解节点是否陷入故障状态。 使用“未就绪”聚合可以快速查看群集中当前处于“未就绪”状态的节点数。
活动 Pod 计数
此性能图表对应于调用 kubectl get pods --all-namespaces
并将“状态”列映射到按状态类型分组的图表。
注意
kubectl
解释的状态名称可能与图表中不完全一致。
后续步骤
查看日志查询示例中的预定义查询和示例,以创建警报、呈现可视化效果或对群集执行进一步分析。