Kubernetes kubelet 状态上报/节点资源的管理 - 代码天地

Kubernetes kubelet 状态上报/节点资源的管理

企业开发 2022-08-28 21:26:59 阅读次数: 0

NUMA

针对多核的计算机架构，一个计算机上面会有多个CPU的插槽，它也会有多个内存的插槽，这样从硬件体系来看，不同的CPU和内存联动的关系就不一样的，可以看到每个numa node有独立的cpu和内存。

所以的话cpu在访问内存的时候，如果这些内存在不同的numa节点上面，它们的访问效率是不一样的。

节点资源管理

状态上报

kubelet最重要的职责是去监听APIServer，然后有任何pod清单的变更，它要来处理这个pod的生命周期，另外就是间歇性的汇报节点的状态，往apiserver去上报。

上报有两部分内容，一部分是节点的健康信息，也就是这个节点是不是还活着，第二个就是节点的资源使用情况。

这个资源使用情况更多的是及时的汇报给集群，让apiserver知道从资源使用情况来说资源承载的压力是怎么样的。

如果有内存压力或者磁盘压力，那么调度器就不应该将pod再调度过去了。

Lease

状态如何上报的，在早期kubelet的版本里面，通常健康状况和资源使用情况是一起上报的，那么每次上报第一要确保时效性，因为你周期太长的话，节点坏了，APIserver看你还不知道，那么就需要保持时效性，汇报的频度就比较快，汇报频度快，每次都带着详细信息，那么就意味着数据传输量比较大，节点层面信息量不一定大，但是集群很大的时候，那么apiserver承受的并发压力还是不小的。

后期资源上报和健康状态的上报都被拆离开来了，健康状态的上报就是通过lease对象去上报的，默认上报会以40s为周期不断的向上汇报，资源使用情况是使用更加慢的频率去上报的。

kubectl describe node xx所看的这些信息都会统一上报，这些信息是按照资源信息去去上报的。

可以看到每个节点都有lease对象，这个lease对象里面存的是，之前说controller manager的时候说过，当多个节点要去持有，想去开启leader election模式的时候，当有多个控制器，那么就需要一个人去抢锁，抢到锁之后就需要不停的renew，其他人抢不到这个锁，它就要一直监听，直到leader没有renew及时renew，它的任期过期了，那么后面的人就可以获取锁继续指向。

所以都会有个任期的概念，所以为了支持这种模式，后期k8s就将任期变为了一个对象叫做lease这样一个对象，这个对象就适用于leader election场景，对于新版本的k8s的leader election不用去创建configmap或者secret或者endpoint，你应该依赖的对象就是lease对象，所以lease对象的spec就是将我们之前看到的configmap里面的或者endpoint里面的annotation变为标准化了。

这里面定义了holderidentity是谁，也就是lease是谁持有的，然后租约是多久40s，renew是多久去更新它的。

也就是k8s会不停的更新去更新这个renew time，来确保节点的租约一直有效，通过这种方式，虽然没有人和它抢锁，但是它自己可以来renew这个lease对象来代表自己是活着的，通过维护有效租期来达到这个目的。

所以renewtime是不停的变化的，所以kubelet会一直每隔40s会去续约。

资源预留

任何计算节点，除了用户的容器之外，还有支撑系统运行的基础服务，这些服务不是通过kuberenetes拉起来的，这些服务是有资源开销的，有资源开销就需要为其预留一些，否则不为这些服务预留，通常配置k8s的时候都会去定义一下要为这个系统预留多少资源，然后剩下的才是可以分配的资源。

Capacity和Allocated

capacity更多的是我这个节点的能力是多少，这些信息是从/proc/cpuinfo中去取的，你真正的预留的资源是capacity - allocated资源。

节点磁盘管理

节点磁盘管理通常可以分为nodefs和imagefs，nodefs是保存了工作目录，就是保存了datadir和logdir容器日志的目录。（比如empty dir和它日志这些数据目录所在的地方）

imagefs就是当我这个容器镜像层层加载的时候，它所解压文件所在的目录。

上面两个是可以独立管控的，分别为这两个文件系统配置容量，当然你也可以不设置imagefs统一的纳管起来。

驱逐管理

kubelet在资源不够的情况下要终止容器进程，使得这些资源可以释放，保证节点不死。

Kubelet发起的驱逐，它需要留下一些痕迹，不能只将pod删除掉，从用户的角度都看不到发生了什么事件，发生驱逐的时候是通过evict命令将pod驱逐掉，它并不会删除pod，这个pod的实体还在，但是会将其状态置为evicted。

这个目的是为了你做审计的时候，无论作为管理员还是用户，只要查看evict的message就可以知道它之前发生了什么事情。

资源可以额监控

驱逐策略

可以设置回收的最小值，什么情况下发起驱逐，每次驱逐的时候最少要驱逐多少，通过这种方式防止小资源多次回收，就一次性回收，若不是回收一点再看是不是承压，这样效果就慢。通过这个参数设置最少一次要驱逐多少。

硬驱逐：设定当低于这个值的时候，我就要去做硬驱逐。然后下面是定义，定义每次至少要驱逐多少资源。

nodefs和imagefs区别，nodefs就是容器的数据目录和日志所在的目录，无论是contained还是docker存放的目录都是在/bvar/lib/kubelet下面，这个数据和日志都在这下面。

imagesfs，当overyfs去加载一个容器镜像的时候，存在的路径为/var/lib/container /var/lib/docker。

所以可以分别针对这两个文件路径去设置驱逐阈值，也可以将其合并，一起去设置。

基于内存压力的驱逐

besteffort是不申请任何的资源，节点都扛不住压力了，肯定不认你过来。

针对grantee类型pod，它一定不会超过的，大部分情况下pod可以通过burtest超售方式去增加部署密度，总量超出了request，超出request的pod会成为被选目标。

还有就是超过的越多，越容易被驱逐。通过这种策略层层筛选，选择出驱逐的pod进行驱逐。

基于磁盘压力驱逐

nodefs上可用的磁盘空间，以及索引inde可用的值，达到的驱逐条件，或者imagefs达到的驱逐条件，它一样的会将节点的DiskPressure设置为true。

删除了已经退出的容器和未使用的镜像，这个节点的磁盘还有可能承压，这个时候kubelet会继续的去释放空间要去驱逐正在运行的pod。

容器和资源配置

针对于任何的pod都会落在不同的qos class。

Cgroup配置

OOM Killer行为

猜你喜欢

转载自blog.csdn.net/qq_34556414/article/details/126413559

Kubernetes kubelet 状态上报/节点资源的管理

kubernetes的Kubelet

Kubernetes Kubelet 状态更新机制

Kubernetes Kubelet管理pod核心流程

【kubernetes/k8s源码分析】kubelet源码分析之资源上报

kubelet 安装kubernetes

kubernetes部署-kubelet(六)

Kubernetes 聚焦Kubelet职责

Kubernetes Kubelet 线程泄漏

kubernetes 组件之 kubelet

kubernetes kubelet 配置

kubernetes kubelet Overiview

kubernetes集群安装指南：worker节点组件kubelet部署

# IT明星不是梦 # 图解kubernetes Kubelet驱逐管理关键实现

Kubernetes之Kubelet组件解析

Kubernetes探秘—kubelet的配置参数

Kubernetes kubelet 硬核知识架构

CoreOS集成Kubernetes核心组件Kubelet

CoreOS Linux引入了Kubernetes kubelet

kubernetes-kubelet进程源码分析（三）

kubernetes-kubelet进程源码分析（二）

kubernetes-kubelet进程源码分析（一）

kubernetes源码阅读笔记——Kubelet（之二）

kubernetes源码阅读笔记——Kubelet（之四）

Kubernetes v1.14.0 之 kubelet部署

用kubespray部署kubernetes后修改kubelet的

kubernetes kubelet组件中cgroup的层层"戒备"

【转载】Kubernetes核心原理（四）之Kubelet

kubernetes+virtual-kubelet对接openstack zun

Easypack: Kubernetes 1.17.2 设定选项更新：Kubelet

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)