spark进行map,join分worker数少的一些问题

编程语言 2018-04-24 10:48:50 阅读次数: 2

1、fullouterjoin导致的分配worker少：

一开始

然后加coalesce（1000）

还是用的worker很少

然后调整join顺序，之前是（小数据）fullouterjoin(大数据)，把大小数据顺序调换，worker多了，执行变快

最后结果

2、flatmap导致的分配worker少：flatmap(...).saveAsTextFile() 改为 flatmap(...).coalesce(1000).saveAsTextFile()

3、一个问题，为什么失败的job也一直占着资源？

猜你喜欢

转载自blog.csdn.net/GOGOAWAY/article/details/80061094

spark进行map,join分worker数少的一些问题

关于Map的一些问题

map需要注意的一些问题

并发List、Map的一些问题

Spark和hbase集成遇到的一些问题

Freemarker 数据进行计算的一些问题

关于mysql与eclipse进行连接的一些问题

分库分表带来的一些问题

一些问题

记录使用map遇到的一些问题之内存泄露问题

spark 使用中会遇到的一些问题及解决思路

在spark集群中运行程序遇到的一些问题

Js的一些问题

Cordova一些问题

jquery一些问题

遇到的一些问题

一些问题的积累

单链表的一些问题

jasperreport一些问题

svn 初学的一些问题

maven一些问题

软件测试的一些问题

Faban的一些问题

eclipse 的一些问题总结

SVN的一些问题

Solr 的一些问题小结

编译Faban的一些问题

Flying Saucer一些问题

python遇到的一些问题

fork、vfork的一些问题

今日推荐

周排行

回表和覆盖索引

设计模式-template method

GLES3.0中文API-glDrawElements

Java中类之间的关系

iPhone应用提交流程：如何将App程序发布到App Store

关于c内联函数不能有循环递归

移动端点击事件、滑动不可用的坑~~

16，SSH远程登录服务

SqlDataReader C#数据库查询结果数据

痴情研究java内存中的对象

每日归档

2024-06-17(0)

2024-06-16(0)

2024-06-15(0)

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)