Spark 和 Hadoop 架构区别（全新视角） - 代码天地

Spark 和 Hadoop 架构区别（全新视角）

其他 2020-05-14 13:43:50 阅读次数: 0

文章目录:

1、Spark和Hadoop的架构区别
2、Spark 和Hadoop的中间计算结果处理区别
3、Spark 和Hadoop的操作模型区别

《转载注明出处，你的点赞是我的动力。》

1、Spark和Hadoop的架构区别

Hadoop ：mapreduce 有Map和reduce两个阶段，并通过Shuffle将两个阶段连接起来的。但是套用MapReduce 模型解决问题，不得不将
问题分解为若干个有依赖关系的子问题，每个子问题对应一个MapReduce作也，最终将作业生成一个DAG。

Spark ：是通用的DAG框架，可以将多个依赖关系放入作业转换为一个大的DAG。核心思想是将map和reduce两个操作进一步拆分为多个元操作，
这些元操作可以灵活组合，产生新的操作，并经过一些控制程序组装后形成一个大的DAG作业。

2、Spark 和Hadoop的中间计算结果处理区别

Hadoop ：在DAG 中，由于多个MapReduce作业生成，每个作业都会从HDFS上读取一次数据和写一次数据（默认写三份），即使这些MapReduce
作业产生的数据是中间数据也需要写HDFS。这种表达作业依赖关系的方式比较抵效，会浪费大量不必要的磁盘和网络IO，根本原因是作业之间产生的数据不
是直接流动的，而是借助HDFS作为共享数据存储系统。

Spark ：在Spark 中，使用内存（内存不够使用本地磁盘）替代了使用HDFS存储中间结果。对于迭代运算效率更高。

3、Spark 和Hadoop的操作模型区别

Hadoop：只提供了map和reduce两种操作所有的作业都得转换成Map和reduce操作。
Spark：提供了多种数据集操作类型比如：
Teansformations包括：
Map,
filter,
flatMap,
sample,
groupbyKey,
reduceByKey
sory,
partitionByKey 等 …

actions包括：
count，
collect，
reduce，
lookup，
save等多种。

寄语专区：

《转载注明出处，你的点赞是我的动力。》

在这里插入图片描述

靠自己A.

原创文章 61 获赞 79 访问量 2万+

关注私信

猜你喜欢

转载自blog.csdn.net/weixin_46163590/article/details/105902267

Spark 和 Hadoop 架构区别（全新视角）

Hadoop和Spark的区别

spark和hadoop的区别

Hadoop和Spark区别

Spark和Hadoop的架构区别解读

Spark是什么？Spark和Hadoop的区别

Spark Hadoop联系和区别

Hadoop和Spark联系与区别

Spark和Hadoop以及区别

Hadoop、MapReduce、YARN和Spark的区别与联系

hadoop和spark的区别介绍

Hadoop、storm和Spark的区别、比较

大数据框架hadoop和spark的区别

秒懂Hadoop和Spark联系与区别

Hadoop，MapReduce，YARN和Spark的区别与联系

简单理解Hadoop和Spark的区别

Spark和Hadoop作业之间的区别

Hadoop和Spark的前世今生 & MR、Yarn、Spark架构原理

Hadoop 和 Spark异同

Hadoop和Spark的异同

Hadoop，Spark和Storm

Spark和Hadoop关系

Hadoop、Spark和Storm

Spark和Hadoop的异同

Spark和Hadoop优劣

hadoop 和 spark 小结

大数据框架Hadoop和Spark的区别和关系

spark与Hadoop的区别

Hadoop、Spark与Flink的基础架构及其关系和优异

Spark和hadoop对比之spark解析

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)