1。mapreduce 中map内存溢出如何解决
找到hive-env.sh文件
打开后配置HADOOP_OPTS
加上
-
if [ "$SERVICE" = "hiveserver2" ]; then
-
echo $HADOOP_OPTS
-
export HADOOP_OPTS="$HADOOP_OPTS -XX:PermSize=512M -XX:MaxPermSize=1024M"
-
echo $HADOOP_OPTS
-
fi
保存
再启动后内存就已经改过来了
当然,其他java的内存参数也能自己配
2.reduce 二次排序解决方案
3.数据倾斜解决方案
4.如何在分布式系统中保持业务主键同步
5.多个有序链表如何组合链表排序
通过归并排序
6.海量数据查重,内存没法装下
解决思路?
待补充,有知道的可以留言