Spark与MapReduce的区别是什么？ - 代码天地

Spark与MapReduce的区别是什么？

其他 2021-03-31 08:02:22 阅读次数: 0

Spark和MapReduce都是可以处理海量数据，但是在处理方式和处理速度上存在着差异，总结如下：

1.spark处理数据是基于内存的，而MapReduce是基于磁盘处理数据的。

MapReduce是将中间结果保存到磁盘中，减少了内存占用，牺牲了计算性能。

Spark是将计算的中间结果保存到内存中，可以反复利用，提高了处理数据的性能。

2.Spark在处理数据时构建了DAG有向无环图，减少了shuffle和数据落地磁盘的次数

Spark 计算比 MapReduce 快的根本原因在于 DAG 计算模型。一般而言，DAG 相比MapReduce 在大多数情况下可以减少 shuffle 次数。Spark 的 DAGScheduler 相当于一个改进版的 MapReduce，如果计算不涉及与其他节点进行数据交换，Spark 可以在内存中一次性完成这些操作，也就是中间结果无须落盘，减少了磁盘 IO 的操作。但是，如果计算过程中涉及数据交换，Spark 也是会把 shuffle 的数据写磁盘的！有一个误区，Spark 是基于内存的计算，所以快，这不是主要原因，要对数据做计算，必然得加载到内存，Hadoop 也是如此，只不过 Spark 支持将需要反复用到的数据给 Cache 到内存中，减少数据加载耗时，所以 Spark 跑机器学习算法比较在行（需要对数据进行反复迭代）

3.Spark是粗粒度资源申请，而MapReduce是细粒度资源申请

粗粒度申请资源指的是在提交资源时，spark会提前向资源管理器（yarn，mess）将资源申请完毕，如果申请不到资源就等待，如果申请到就运行task任务，而不需要task再去申请资源。

MapReduce是细粒度申请资源，提交任务，task自己申请资源自己运行程序，自己释放资源，虽然资源能够充分利用，但是这样任务运行的很慢。

https://blog.csdn.net/JENREY/article/details/84873874

猜你喜欢

转载自blog.csdn.net/u013963379/article/details/106460616

Spark与MapReduce的区别是什么？

& 与 && 区别是什么？

Spark与Hadoop的区别是什么？请举例说明。

类的区别是什么？

&和&&的区别是什么

#{}和${}的区别是什么？

#{}和${}的区别是什么

spark是什么？spark和MapReduce的区别？spark为什么比hive速度快？

Hive的底层计算框架默认是MapReduce，还有两种是Tez和Spark这几种的区别是什么？计算速度上为什么会有明显的差异？

线程和进程的区别是什么？

MyISAM与InnoDB的区别是什么？

《openstack 和hadoop的区别是什么？》

CPU 和 GPU 的区别是什么？

@synthesize和@dynamic的区别是什么？

tomcat 与 nginx，apache的区别是什么？

localhost与127.0.0.1的区别是什么

@Autowired和@Resource的区别是什么？

JRE 和 JDK 的区别是什么？

进程和线程的区别是什么？

分类与回归区别是什么？

JDK和JRE的区别是什么？

DataFrame的iloc与loc的区别是什么？

jsp中<%%> 与<%!%> ， <%%>与<%=%>的区别是什么？

cookie和session的区别是什么?

TCP和UDP的区别是什么？

mybatis #{}和${}的区别是什么？

Film和movie的区别是什么

LR,SVM，RF的区别是什么？

GBDT,XGBoost，RF的区别是什么？

mybatis中#{}和${}的区别是什么？

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)