23. 资源的调度——Pod 优先级调度(Pod Priority Preemption)

本章讲解知识点

    1. Pod 优先级调度
    1. QoS


1. Pod 优先级调度

1.1 前言

出于各种原因,对于运行各种负载(如:Deployment、StatefulSet、DeamonSet)的中等规模或大规模集群,我们需要尽可能提高其资源利用率。

一种常见的提高资源利用率的方法是采用优先级方案,即为不同类型的负载分配不同的优先级。同时,允许所有负载所需的资源总量超过集群可提供的资源。在资源不足的情况下,系统可以根据优先级释放一些不重要的负载(优先级最低的),以保障最重要的负载能够获取足够的资源稳定运行。

在 Kubernetes 1.8 版本之前,当集群的可用资源不足时,在用户提交新的 Pod 创建请求后,该 Pod 会一直处于 Pending 状态,即使这个 Pod 是一个很重要的 Pod,也只能被动等待其他 Pod 被删除并释放资源,才能有机会被调度成功。Kubernetes 1.8 版本引入了基于 Pod 优先级抢占的调度策略,此时 Kubernetes 会尝试释放目标节点上低优先级的 Pod,以腾出空间(资源)安置高优先级的 Pod,这种调度方式被称为“抢占式调度”。在 Kubernetes 1.11 以后版本,该特性默认开启。但如何声明一个负载相对其他负载更重要?我们可以通过以下几个维度来定义&#

猜你喜欢

转载自blog.csdn.net/qq_32468785/article/details/130504770