Spark并不都是基于内存计算

大多数的人会认为Spark都是基于内存的计算的,但是基于如下两个情况,Spark会落地于磁盘

1,Spark避免不了shuffle

2,如果数据过大(比服务器的内存还大)也会落地于磁盘

猜你喜欢

转载自blog.csdn.net/afafawfaf/article/details/81006875