Spark为什么比Hadoop好？ - 代码天地

Spark为什么比Hadoop好？

其他 2018-11-08 16:37:55 阅读次数: 0

（1）Spark计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk

Hadoop每次计算先写磁盘，下次计算先从磁盘读，计算结果再写磁盘，如此往复。这对于迭代计算，是个噩梦

-----Spark为每个应用程序在worker上开启一个进程，而一个Job中的Task会在同一个线程池中运行，而Hadoop Map Reduce的计算模型是每个Task(Mapper或者Reducer）都是一个单独的进程，启动停止进程非常expensive，同时，进程间的数据共享也不能基于内存，只能是HDFS。
Spark任务调度模型

-----一级调度DAGScheduler
-----二级调度TaskScheduler

（2）MapReduce在数据shuffle之前需要进行排序，而spark不需要对所有场景进行排序，这也就加快了spark的计算速度

（3）spark中RDD之间维护了血缘关系，一旦某个RDD失败了，就能通过父类RDD自动重建，保证了容错性

（4）spark的代码量比mapreduce少的多

（5）Spark更通用，提供了transformation和action这两大类的多功能api，另外还有流式处理sparkstreaming模块、图计算等等，mapreduce只提供了map和reduce两种操作，流计算及其他的模块支持比较缺乏。

猜你喜欢

转载自www.cnblogs.com/wangleBlogs/p/9929800.html

Spark为什么比Hadoop好？

Spark入门——什么是Hadoop，为什么是Spark?

Spark 为什么比Hadoop快

Spark为什么比Hadoop快？

【Spark系列】：Spark为什么比Hadoop快

spark为什么比hadoop的mr要快？

深度解析Spark 为什么优于 Hadoop ！

面试必备——Spark为什么比Hadoop快

Hadoop和Spark为什么要对key进行排序

学Hadoop还是Spark好？

Hadoop与Spark之间有什么区别，为什么有这么多人不看好Hadoop，而力捧Spark

spark与hadoop的关联和区别，以及spark为什么那么快

Hadoop与Spark是什么？

为什么选择spark

为什么好、为什么不好

【hadoop】为什么要用hadoop？

为什么 Git 比 SVN 好

丝印为什么效果好？

数据分析平台为什么使用Hadoop，不使用spark？

既然有了elasticsearch为什么还要用hadoop和spark呢？good question

Spark是什么？Spark和Hadoop的区别

ReLU为什么比Sigmoid效果好

为什么 if else 不是好代码？

ConcurrentHashMap为什么比HashTable性能好？

为什么 if-else 不是好代码

好的产品经理为什么那么少？

为什么https协议比http协议好？

batch-normalization为什么效果好

Linux服务器为什么好？

为什么NIO性能好？

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)