Hadoop Storm Spark比较 - 代码天地

Hadoop Storm Spark比较

其他 2018-05-30 12:47:25 阅读次数: 0

Hadoop

Hadoop是磁盘级计算，进行计算时，数据在磁盘上，需要读写磁盘;

Hadoop M/R基于HDFS，需要切分输入数据、产生中间数据文件、排序、数据压缩、多份复制等，效率较低。

假设利用hadoop，则需要先存入hdfs，按每一分钟切一个文件的粒度来算（这个粒度已经极端的细了，再小的话hdfs上会一堆小文件），hadoop开始计算时，1分钟已经过去了，然后再开始调度任务又花了一分钟，然后作业运行起来，假设机器特别多，几钞钟就算完了，然后写数据库假设也花了很少的时间，这样，从数据产生到最后可以使用已经过去了至少两分多钟。

Strom

Storm是内存级计算，数据直接通过网络导入内存,磁盘访问延迟约为内存访问延迟的75000倍;

storm的网络直传、内存计算，其时延必然比hadoop的通过hdfs传输低得多；当计算模型比较适合流式时，storm的流式处理，省去了批处理的收集数据的时间；因为storm是服务型的作业，也省去了作业调度的时延。所以从时延上来看，storm要快于hadoop。

流式计算是数据产生时，则有一个程序去一直监控日志的产生，产生一行就通过一个传输系统发给流式计算系统，然后流式计算系统直接处理，处理完之后直接写入数据库，每条数据从产生到写入数据库，在资源充足时可以在毫秒级别完成。
Storm 基于ZeroMQ这个高性能的消息通讯库，不持久化数据；

=====================
两者面向的领域也不完全相同，一个是批量处理，基于任务调度的；另外一个是实时处理，基于流。
以水为例，Hadoop可以看作是纯净水，一桶桶地搬；而Storm是用水管，预先接好（Topology），然后打开水龙头，水就源源不断地流出来了

Spark

备注

注释：
1. 延时，指数据从产生到运算产生结果的时间，“快”应该主要指这个。
2. 吞吐，指系统单位时间处理的数据量。

猜你喜欢

转载自blog.csdn.net/sean_cd/article/details/72818090

Hadoop Storm Spark比较

Hadoop、Storm、Spark的区别与比较

Hadoop、storm和Spark的区别、比较

Hadoop ，storm，spark 的特点

Hadoop，Spark和Storm

Storm, Spark, Hadoop

Hadoop、Spark和Storm

Hadoop、Storm和Spark 三者的区别、比较

大数据晋级之路（5）Hadoop，Spark，Storm综合比较

Storm与Spark Streaming比较

“大数据” Hadoop，Spark和Storm

hadoop spark hive storm的发展过程

大数据” Hadoop，Spark和Storm

Storm与Spark，Hadoop相比是否有优势

Hadoop Hive HBase Spark Storm概念解释

大数据Hadoop Hive HBase Spark Storm

从大数据到Hadoop，Spark，Storm

Hadoop、Spark、Storm、Flink区别及选择

大数据计算架构Hadoop、Spark和Storm 三者技术比较

Hadoop，Spark和Storm三大分布式计算系统简介及比较

大数据架构Hadoop、Spark和Storm 三者技术比较

Spark Streaming、Storm、Flink比较

hadoop、spark/storm等大数据相关视频资料汇总下载

大数据Storm相比于Spark、Hadoop有哪些优势(摘录)

Storm与Spark、Hadoop三种框架对比

大数据框架对比：Hadoop、Storm、Samza、Spark和Flink

Hadoop，Spark，Storm，Docker，Mapreduce，Kafka深入解析

Hadoop相关项目Hive-Pig-Spark-Storm-HBase-Sqoop

Hadoop、storm和Spark Streaming简单介绍（非原创）

大数据框架--hadoop、spark、storm、flink、Samza介绍与对比

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)