Hadoop和spark的性能比较 - 代码天地

Hadoop和spark的性能比较

其他 2019-06-18 03:24:23 阅读次数: 0

Hadoop和spark的性能有何区别。

如果说Hadoop是一家大型包工队，我们可以通过它组织人员进行合作，搬砖建造房屋，弊端在于速度较慢。

Spark是另一家包工队，成立时间较晚，但是他们搬砖更为灵活，可以实时交互地盖房子，工作效率比Hadoop快得多。

当Hadoop开始升级，指定调度专家YARN调度工人。Spark从多个仓库搬砖(HDFS，Cassandra,S3，HBase)，还允许不同专家如YARN/ MESOS对人员和任务进行调度。

当然，Spark和Hadoop团队进行合作，问题变得更加复杂。作为两个独立的包工队，二者都有着各自的优缺点和特定的业务用例。

因此，我们说Hadoop和spark的性能区别在于：

Spark在内存中运行速度比Hadoop快100倍，在磁盘上运行速度快10倍。众所周知，Spark在数量只有十分之一的机器上，对100TB数据进行排序的速度比Hadoop MapReduce快3倍。此外，Spark在机器学习应用中的速度同样更快，例如Naive Bayes和k-means。

Spark性能之所以比Hadoop更优，原因在于每次运行MapReduce任务时，Spark都不会受到输入输出的限制。事实证明，应用程序的速度要快得多。再有Spark的DAG可以在各个步骤之间进行优化。Hadoop在MapReduce步骤之间没有任何周期性连接，这意味着在该级别不会发生性能调整。但是，如果Spark与其他共享服务在YARN上运行，则性能可能会降低并导致RAM开销内存泄漏。出于这个原因，如果用户有批处理的诉求，Hadoop被认为是更高效的系统。

猜你喜欢

转载自blog.csdn.net/kangshufu/article/details/92431496

Hadoop和spark的性能比较

Hadoop与spark性能比较试验

好程序员技术解析Hadoop和spark的性能比较

exists 和 in的性能比较

Presto与Spark SQL查询性能比较

sparksql和mysql性能比较

codis和jedis性能比较

ibatis和hibernate的性能比较

String和stringbuild性能比较

JAVA和CPP的性能比较

malloc和memset性能比较

Cassandra HBase和MongoDb性能比较

CriticalSection 和Mutex 性能比较

RDL和RDLC性能比较

exp和expdp 导出性能比较

chrome，FireFox和Edge性能比较

Hive的distinct和group by性能比较

insert into 和insert into select性能比较

MongoDB 和 PostgreSQL 性能比较

12 | QChart和QCustomPlot的性能比较

go和swoole性能比较

Cassandra HBase和MongoDb性能比较（转） Cassandra HBase和MongoDb性能比较

HttpServer性能比较

if与switch的性能比较

rocksdb和leveldb性能比较——写性能

Spring MVC 和Struts2的性能比较

shell中let和expr用法及性能比较

NginX 1.2.0 和 Resin 4.0.29 的性能比较测试

MySQL中distinct和group by性能比较[转]

Python中in和has_key的性能比较

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)