【图文详细 】HDFS面试题:当小文件数量过多时,如何合并小文件

版权声明:版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/qq_42246689/article/details/84639089

当每个小文件数据量比较小的时候,可以通过命令的方式进行小文件的合并如:

hadoop fs -cat hdfs://cdh5/tmp/lxw1234/*.txt | hadoop fs -appendToFile - hdfs://cdh5/tmp/hdfs_largefile.txt,当数据量比较大的时候建议使用MR进行小文件的合并

猜你喜欢

转载自blog.csdn.net/qq_42246689/article/details/84639089