spark小文件过多

参考https://www.cnblogs.com/flymin/p/11345646.html

小文件:存储于HDFS中小文件,即指文件的大小远小于HDFS上块(dfs.block.size)大小的文件。

猜你喜欢

转载自www.cnblogs.com/gouhaiping/p/12437414.html