大数据集群需定期清理的文件（节省空间） - 代码天地

大数据集群需定期清理的文件（节省空间）

编程语言 2023-09-05 18:22:05 阅读次数: 0

大数据集群需定期清理的文件（节省空间）

1.由于HDFS有回收站，如何设置不合理的话，它会长时间占用集群资源，因此我们首先清理HDFS回收站。
在平时删除HDFS文件时，可以使用命令：hdfs dfs -rm -skipTrash /path/to/file/you/want/to/remove/permanently，这样的话文件就直接删除了，不会放在回收站（注：此种删除为永久删除，无法恢复数据），用这个命令删除HDFS数据的话，后期就无需清空HDFS回收站
清空回收站命令：hdfs dfs -expunge （注：执行完命令后，回收站的数据不会立即被清理，而是先打了一个checkpoint。显示的是一分钟后清除。）
2.清空spark任务执行历史记录（如果通过spark任务写入大量数据到大数据平台，那么spark任务历史记录会占很大空间，因此需要我们定期清理）
清除掉 /user/spark/applicationHistory/*路径下的文件（查看该路径下文件命令：hadoop fs -ls /user/spark/applicationHistory，查看该路径下文件占用磁盘大小：hadoop fs -du -h /user/spark/applicationHistory）
清掉spark任务执行历史记录后再把回收站清理一下。
3.yarn缓存文件清理
/yarn/nm下，主要清空filecahe里的文件，这部分最站磁盘
/yarn/container-logs下，如果数据量大的话也要清理掉
4.hdfs数据做定期处理
5.集群各组件日志做定期处理

猜你喜欢

转载自blog.csdn.net/qq_43688472/article/details/132490255

大数据集群需定期清理的文件（节省空间）

大数据集群清理缓存

定期清理文件

CDH 集群定期清理指南

HDFS数据定期清理

shell脚本定期清理文件

linux定期清理数据——crontab

【Shell】定期自动删除log或其他指定文件清理磁盘空间

【docker】清理docker系统垃圾文件，节省磁盘空间，保留最新的镜像，使用docker system 命令

OGG mgr定期清理tail 文件

shell脚本-------------定期清理日志文件

Sonatype Nexus 定期清理Snapshots节约磁盘空间

如何定期清理数据库中的历史数据？

【Shell实战】定期清理日志文件的shell脚本

Linux 系统中所有log 日志文件定期清理。

脚本定期清理zk快照和日志文件

Oracle 11g OGG mgr定期清理tail 文件

脚本定期清理日志

定期清理日志相关

删除ntbackup的编录文件，节省C盘空间

定期删除各子文件下数据

ORACLE定期清理INACTIVE会话

定期清理hdfs日志脚本

docker日志设置定期清理

定期清理elasticsearch中的索引

myssql日志需要定期清理

大数据集群搭建

大数据：集群优化

大数据集群测试

大数据平台集群

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)