kubernetes：Cronjobs属性failedJobsHistoryLimit不生效，不能自动清理状态为Error的Pod

其他 2020-04-15 11:15:47 阅读次数: 0

Cronjobs属性failedJobsHistoryLimit不生效

问题现象

在《Kubernetes： Job 和 CronJob 的实现原理》一文中，我们提到cron中有如下属性可以设置任务保留个数

（1.8版本后）.spec.successfulJobsHistoryLimit 和 .spec.failedJobsHistoryLimit是可选的。这两个域声明了有多少执行完成和失败的任务会被保留。默认设置为3和1。限制设置为0代表相应类型的任务完成后不会保留。

特别注意：1.8版本之前，是保留所有的历史job

但是，当我们设置Cronjobs属性failedJobsHistoryLimit为2（默认为1），他并没有自动清理状态为Error的Pod,
错误pod的增多，导致不停占用我们node节点的cpu和memory资源，甚至造成资源耗尽。

问题解决

在job中添加如下两个属性：

activeDeadlineSeconds标志失败Pod的重试最大时间，超过这个时间不会继续重试

backoffLimit 就是来保证一个 Job 到底能重试多少次。Job 在运行的时候不可能去无限的重试，所以我们需要一个参数来控制重试的次数。

注意：backoffLimit，默认是6。如果需要修改backoffLimit值，同时需要设置restartPolicy为Never，如果设置restartPolicy为OnFailure，当job失败时达到backoffLimit的重试次数，就会停止job运行。

restartPolicy，在 Job 里面我们可以设置 Never、OnFailure、Always 这三种重试策略。在希望 Job 需要重新运行的时候，我们可以用 Never；希望在失败的时候再运行，再重试可以用 OnFailure；或者不论什么情况下都重新运行时 Alway

参考链接：

https://kubernetes.io/zh/docs/tasks/job/automated-tasks-with-cron-jobs/

https://github.com/kubernetes/kubernetes/issues/53331

https://github.com/kubernetes/kubernetes/issues/52390

琦彦博客专家

发布了430 篇原创文章 · 获赞 1473 · 访问量 394万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/fly910905/article/details/104963331

kubernetes：Cronjobs属性failedJobsHistoryLimit不生效，不能自动清理状态为Error的Pod

kubernetes清除状态为Evicted的pod

kubernetes 创建pod 启动不了处于ContainerCreating状态

Kubernetes系列：故障排查之Pod状态为CreateContainerError

Kubernetes pod 状态

Kubernetes之pod的属性

Kubernetes---Pod状态示例

kubernetes 清理孤儿POD--转发

大量pod 状态 CrashLoopBackOff | Error

[Kubernetes]Pod字段自动填充

解决 kubernetes(k8s)创建Dashboard失败，Dashboard的pod状态为CrashLoopBackOff

kubernetes: node节点不能显示pod

Kubernetes pod状态出现CrashLoopBackOff 的原因

Kubernetes pod状态出现ImagePullBackOff的原因

kubernetes集群pod异常状态ContainerCreating的解决

【2023】Kubernetes之Pod与容器状态关系

webstorm 设置js或者html文件自动缩进为4个空格不生效

Azure Kubernetes 水平自动扩充Pod

Kubernetes Pod水平自动伸缩（HPA）

闲聊Kubernetes Pod垂直自动伸缩（VPA）

Kubernetes Pod 水平自动伸缩（HPA）

state更新不生效之——派生状态

pod状态为Back-off

JS图片error事件绑定不生效

jQuery - Ajax - Timeout 属性不生效的问题

antd vue table ellipsis属性不生效

Edittext设置inputType为密码不能生效

Mybatis-plus 自动填充不生效或自动填充数据为null 原因及解决方案

kubernetes-在pod里面的容器不能ping外部ip

outlook2010自动存档不生效

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)