【Spark】Spark 与 Hadoop MR 之间的区别 - 代码天地

【Spark】Spark 与 Hadoop MR 之间的区别

其他 2020-03-15 13:18:47 阅读次数: 0

首先Spark是借鉴了mapreduce并在其基础上发展起来的，继承了其分布式计算的优点并改进了

mapreduce明显的缺陷，但是二者也有不少的差异具体如下：

1、spark把运算的中间数据存放在内存，迭代计算效率更高；mapreduce的中间结果需要落地，需要

保存到磁盘，这样必然会有磁盘io操做，影响性能。

2、spark容错性高，它通过弹性分布式数据集RDD来实现高效容错，RDD是一组分布式的存储在节点

内存中的只读性质的数据集，这些集合是弹性的，某一部分丢失或者出错，可以通过整个数据集的计

算流程的血缘关系来实现重建；mapreduce的话容错可能只能重新计算了，成本较高。

3、spark更加通用，spark提供了transformation和action这两大类的多个功能api，另外还有流式处理

sparkstreaming模块、图计算GraphX等等；mapreduce只提供了map和reduce两种操作，流计算以及

其他模块的支持比较缺乏。

4、spark框架和生态更为复杂，首先有RDD、血缘lineage、执行时的有向无环图DAG、stage划分等

等，很多时候spark作业都需要根据不同业务场景的需要进行调优已达到性能要求；mapreduce框架及

其生态相对较为简单，对性能的要求也相对较弱，但是运行较为稳定，适合长期后台运行。

总结

spark生态更为丰富，功能更为强大、性能更佳，适用范围更广；mapreduce更简单、稳定性好、

适合离线海量数据挖掘计算。

云祁°

发布了334 篇原创文章 · 获赞 227 · 访问量 8万+

私信关注

猜你喜欢

转载自blog.csdn.net/BeiisBei/article/details/104831023

【Spark】Spark 与 Hadoop MR 之间的区别

大数据框架Spark与Hadoop MR的区别

spark和mr的区别

Spark 和与MR的区别

MR与Spark的区别

MR的shuffle和Spark的shuffle之间的区别

spark框架体系及spark和MR的区别

MR和SPARK ON YARN 区别

spark为什么比hadoop的mr要快？

谈谈Hadoop MapReduce和Spark MR实现

Hadoop和Spark的前世今生 & MR、Yarn、Spark架构原理

Hadoop与Spark之间的比较

Spark和Hadoop作业之间的区别

Hadoop和Spark的区别

spark和hadoop的区别

Hadoop和Spark区别

spark与Hadoop的区别

Spark-概述，核心模块介绍，与Hadoop MR的差异

MR (key,value)排序, hadoop.Spark.sql的join操作

Spark是什么？Spark和Hadoop的区别

Hadoop、Hive、Spark 之间关系

Spark和Hadoop之间的关系

Spark Hadoop联系和区别

Hadoop、Storm、Spark的区别与比较

Hadoop和Spark联系与区别

Spark和Hadoop以及区别

hadoop组件---spark----全面了解spark以及与hadoop的区别

Spark与MR异同

Spark-Hadoop、Hive、Spark 之间是什么关系？

Spark(28)-Spark部署模式及与Hadoop之间的联系

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)