Hadoop的Archive归档命令使用指南

其他 2019-01-11 14:41:36 阅读次数: 0

hadoop不适合小文件的存储，小文件本省就占用了很多的metadata，就会造成namenode越来越大。Hadoop Archives的出现视为了缓解大量小文件消耗namenode内存的问题。

采用ARCHIVE 不会减少文件存储大小，只会压缩NAMENODE 的空间使用

1.单文件打包

hadoop archive -archiveName weibotest2014.har -p /crawler/weibo/2014-06-26 /crawler/weibo/

2.多文件夹打包

hadoop archive -archiveName weibotest2014.har -p /crawler/weibo/ 2014-06-26 2014-06-27 /crawler/weibo/

3.匹配打包

hadoop archive -archiveName weibotest2014.har -p /crawler/weibo/ 2014-06* /crawler/weibo/

4.解压

hadoop distcp har:////crawler/weibo/weibotest2014.har /crawler/weibo/

5.查看文件夹大小

扫描二维码关注公众号，回复： 4871346 查看本文章

hadoop fs -du -s /crawler/weibo/2014-06-28

6.删除文件夹

hadoop fs -rm -r /crawler/weibo/2014-06-28

猜你喜欢

转载自www.cnblogs.com/lingwang3/p/10254913.html

Hadoop的Archive归档命令使用指南

Hadoop的Archive归档命令

yum命令使用指南

vim命令使用指南

sar 命令使用指南

lsof 命令使用指南

awk 命令使用指南

Git命令使用指南

Hadoop中的Python框架的使用指南

Linux下Nano命令使用指南

surfingkeys使用指南命令大全

route命令实战使用指南

Hadoop Trash回收站使用指南

HDFS小文件解决方案---archive归档文件命令

Kubeflow使用指南

wps使用指南

sourcetree使用指南

Vagrant使用指南

LXC使用指南

Kryo 使用指南

PaddlePaddle使用指南

TinyXml 使用指南

shark使用指南

Git使用指南

ant 使用指南

Git 使用指南

DOCKER使用指南

jEdit使用指南

Bower 使用指南

Thrift使用指南

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)