服务案例|消失的Linux定时清除任务

企业数字化转型,应用软件不断升级,对运行环境的要求也越来越高,CPU、内存等硬件也同步进入升级。当业务运行或备份时,将产生大量历史文件和临时文件,这就是在运维检测中,我们常看到文件每天几个G,甚至几十G增加的原因。迅猛增长的文件占用大量内存空间,要求足够的硬盘容量支撑系统的正常运行。

受限于硬盘容量,经验型的现场工程师会采用各种技术,自动清除临时数据和历史文件。避免硬盘剩余空间不足,影响系统正常运行等问题。

本期案例分析消失的Linux删除任务,在任务管理出现问题如何快速恢复,为现场工程师提供丰富的样本参考。

一、案例描述

2023年1月,MOC工程师接到平台告警,某学校的Linux服务器/文件目录硬盘空间不足,容量趋势预测将在春节期间,/文件目录空间满。

二、处理过程

1、MOC工程师通知用户,尽快进行历史文件迁移。用户反馈,现场工程师已经配置自动清理的任务计划,到期将自动删除旧备份,无需人工删除历史数据。于是,MOC工程师上调告警阈值,持续观察。

2、上调阈值后,平台仍接到此设备/文件空间不足告警。MOC工程师持续跟进,分别将1月16日和20日/文件剩余空间参数图片发给用户参考。

3、参考三日时序图,C盘存储的文件量持续增加,每日增量大约1.2G,到1月20日磁盘空间仅剩余652MB。此时,仍未启动自动清除计划。

MOC工程师通知现场工程师,告知历史文件自动清除任务未能执行,需要人工手动进行历史文件删除。

4、Linux自动删除任务失败的反思与总结

1)根目录不能存放备份文件和临时文件,根目录满会导致系统无法登录等问题;

2)根目录不建议设置自动清除任务,如误删重要文件,将导致系统崩溃,风险不可控。

三 、案例小结

案例中,用户设置Linux文件自动清理任务,对平台提前预警的磁盘空间不足不予理会,信心满满地准备欢度春节。然而,直到文件占满内存空间,仍未执行自动清除任务,最后不得不加班,手动删除历史数据。

预设方案是否能按计划执行,人工运维,是否会产生疏忽和失误。这是我们监控值守,防止百密一疏的关键。经验虽可取但不能完全依赖。

LinkSLA智能运维管家7*24小时不间断监测,帮助用户实时掌握系统运行状态,提醒系统故障风险和漏洞,线上线下闭环运维,为系统健康稳定保驾护航。

声明:原创内容,转载请注明。

猜你喜欢

转载自blog.csdn.net/LinkSLA/article/details/131533651