Kubernetes监控主要体现在两个方面

对于Kubernetes集群,监控的内容包含以下两个方面:

●基础平台服务的监控

实时监控核心组件(API Server、调度器、控制器、kubelet和kube-proxy等)的健康状态,用以发现用户流量和组件的CPU、内存和网络等的使用情况之间的联系。这些数据不仅能帮助我们甄别出单个组件是否服务异常,还能帮助运维者找出性能出现瓶颈的原因,保证组件有足够的资源满足用户请求,从而进行性能调优。实时监测核心组件之间是否能协调工作,是否能够向用户提供所需服务。

●资源负载状态的监控

监控用户及工作节点的负载状态,包括CPU、内存、磁盘等压力检测,企图将资源耗尽的极端行为得以提前预警。Kubernetes允许多租户在同一集群部署。了解这些数据可以让我们知道租户之间是否相互干扰,还可以让我们知道是否需要对集群进行扩容或缩容,特别是对使用公有云的企业来说,这对控制成本非常有利。

因此,通过一个全面的监控系统来解决集群中数据的收集、分析和执行功能,能够极大地提高应用程序和服务的可用性和性能。一般来说,监控系统的数据分为两大类:指标(Metrics)和日志(Logs)。

图1 监控系统的构成组件

 如图1所示,监控系统负责将数据从集群中收集起来,并拥有对数据展示、处理和分析的能力。它能向其他应用程序暴露指标和日志查询的API接口,能够简单、轻松地扩展监控数据的应用场景。一方面,可以利用可视化工具对关键性能指标数据进行展示和追踪。另一方面,可以利用指标数据进行异常报警,或者触发自动修复和扩容。另外,可以对数据和日志进行分析,进行故障排除、深度诊断和性能调优等。如何更好地使用这两类数据,每个平台或公司需见仁见智,对系统进行充分的模块扩展。

猜你喜欢

转载自blog.csdn.net/m0_60258751/article/details/128333665