将HDFS上的小文件进行归档

归档
/tmp/mes/2020072310   是将HDFS上的那个目录下的文件归档。
/tmp/mes/20200723 归档到那个目录下

hadoop archive -archiveName input.har -p /tmp/mes/2020072310 /tmp/mes/20200723

 

 归档之后:

hadoop fs -ls /tmp/mes/

hadoop fs -ls /tmp/mes/20200723/input.har

 

hadoop fs -ls har:///tmp/mes/20200723/input.har

 

删除与恢复:

hdfs文件被归档后,系统不会自动删除源文件,需要手动删除。

hadoop fs -rmr /tmp/mes/2020072310/*     正则表达式来删除的,大家根据自己的需求删除原始文件

有人说了,我删了,归档文件存在,源文件不在了,如果要恢复怎么办,其实这也很简单,直接从har 文件中 cp出来就可以了。

hadoop fs -cp har:///tmp/mes/20200723/input.har/* /tmp/mes/2020072310/

猜你喜欢

转载自www.cnblogs.com/zpan2019/p/13367787.html