“ error in shuffle in fetcher”的解决方案

问题场景

使用hive进行数据的统计,发现数据进行到一半,就异常退出。查看了报错,是栈溢出,导致了异常。

问题分析

通过查找资料和查看资料,才发现,在shuffle阶段,会将map的output数据给取下来,然后根据设定的参数决定是放进内存中,还是存储到磁盘里面进行操作。而mapreduce.reduce.shuffle.memory.limit.percent这个参数默认值是0.25,代表单个shuffle能够消耗的内存占reduce所有内存的比例。所以将这个参数进行调小操作,那么单个shuffle能够消耗的内存就没办法满足将数据进行处理,就会进而使用磁盘来慢慢操作。

解决方案

mapreduce.reduce.shuffle.memory.limit.percent调为0.1,最后数据统计顺利进行。

发布了43 篇原创文章 · 获赞 4 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/u013084266/article/details/80764047