hive 查看一个表的总文件大小方法

要查看一个hive表文件总大小时,我们可以通过一行脚本快速实现,其命令如下:

$ hadoop fs -ls  /user/hive/warehouse/test_table/ds=20151111|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a}'

32347122009

这样可以省去自己相加,下面命令是列出该表的详细文件列表

hadoop fs -ls  /user/hive/warehouse/test_table/ds=20151111

方法二:查看该表总容量大小,单位为G

 hadoop fs -du /user/hive/warehouse/test_table|awk ' { SUM += $1 } END { print SUM/(1024*1024*1024) }'

猜你喜欢

转载自daizj.iteye.com/blog/2256490