MR与Spark的区别 - 代码天地

MR与Spark的区别

其他 2021-03-31 18:23:03 阅读次数: 0

1、MR与Spark的区别
1.hadoop中的一个任务称为job，一个job分为map task和reduce task 每个task都是在自己的进程中运行的，当task 运行结束以后，进程也会结束

2.spark的一个任务叫做application，一个application中有多个job，每触发一次action操作就会产生一个job，这些job可以并行也可以串行计算，每个job中有多个stage，stage是shuffle过程中DAGScheduler通过RDD之间的依赖关系划分job而来的，每个stage里面有多个task，组成taskset，然后由taskscheduler来进行分发到exector中进行执行，executor的生命周期和app的生命周期是一样的，即使没有job运行也是存在。所以task可以快速启动读取内存进行计算。

3.hadoop的job只有map和reduce操作，表达能力欠缺且在mr过程中会重复的读写hdfs，造成大量的io操作，多个job需要自己管理关系，spark的迭代计算都是在内存汇总进行的，api提供了大量的rdd操作如join，groupby等，而且通过DAG图可以实现良好的容错。

原文链接：https://blog.csdn.net/weixin_43704599/article/details/109610374

猜你喜欢

转载自blog.csdn.net/hzp666/article/details/114971356

spark和mr的区别

Spark 和与MR的区别

MR与Spark的区别

MR和SPARK ON YARN 区别

spark框架体系及spark和MR的区别

【Spark】Spark 与 Hadoop MR 之间的区别

MR的shuffle和Spark的shuffle之间的区别

大数据框架Spark与Hadoop MR的区别

Spark与MR异同

Livy submit mr、spark job

sparksql\hive on spark\hive on mr

MR，Spark提交任务的方式

“数仓”-MPP与 MR的区别

Spark与MR输出文件排序比较

spark为什么比hadoop的mr要快？

谈谈Hadoop MapReduce和Spark MR实现

Hadoop和Spark的前世今生 & MR、Yarn、Spark架构原理

MR

MPP架构与大数据mr的理论区别

MapReduce基础原理、MR与MPP区别

YARN, MR History Server和Spark History Server

KNN在MR和Spark下实现的IO操作比较

mr和spark的shuffer过程详解及对比优化

Spark-概述，核心模块介绍，与Hadoop MR的差异

MR (key,value)排序, hadoop.Spark.sql的join操作

AR VR MR 到底有啥区别？

AR / MR / VR / XR有什么区别？

AR、MR、VR、CR、XR有什么区别？

VR/AR/MR/XR 几种虚拟现实技术的区别

Spark和MapReduce的区别

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)