Hadoop，Spark和Storm三大分布式计算系统简介及比较

其他 2018-09-05 23:37:43 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/cjDaShuJu_Java/article/details/80020619

Hadoop，Spark和Storm

由于Google没有开源Google分布式计算模型的技术实现，所以其他互联网公司只能根据Google三篇技术论文中的相关原理，搭建自己的分布式计算系统。

Yahoo的工程师Doug Cutting和Mike Cafarella在2005年合作开发了分布式计算系统Hadoop。后来，Hadoop被贡献给了Apache基金会，成为了Apache基金会的开源项目。Doug Cutting也成为Apache基金会的主席，主持Hadoop的开发工作。

Hadoop采用MapReduce分布式计算框架，并根据GFS开发了HDFS分布式文件系统，根据BigTable开发了HBase数据存储系统。

不过，Hadoop的开源特性使其成为分布式计算系统的事实上的国际标准。Yahoo，Facebook，Amazon以及国内的百度，阿里巴巴等众多互联网公司都以Hadoop为基础搭建自己的分布式计算系统。

Spark也是Apache基金会的开源项目，它由加州大学伯克利分校的实验室开发，是另外一种重要的分布式计算系统。它在Hadoop的基础上进行了一些架构上的改良。

Spark与Hadoop的区别在什么地方？

Spark与Hadoop最大的不同点在于，Hadoop使用硬盘来存储数据，而Spark使用内存来存储数据，因此Spark可以提供超过Hadoop100倍的运算速度。但是，由于内存断电后会丢失数据，Spark不能用于处理需要长期保存的数据。

扫描二维码关注公众号，回复： 3075285 查看本文章

Storm的架构的最显著的特点是什么？

不同于Hadoop和Spark，Storm不进行数据的收集和存储工作，它直接通过网络实时的接受数据并且实时的处理数据，然后直接通过网络实时的传回结果。

是Twitter主推的分布式计算系统，它由BackType团队开发，是Apache基金会的孵化项目。它在Hadoop的基础上提供了实时运算的特性，可以实时的处理大数据流。

Hadoop，Spark和Storm是目前最重要的三大分布式计算系统，各自的优点如下：

Hadoop常用于离线的复杂的大数据处理，

Spark常用于离线的快速的大数据处理，（spark streaming可以实时处理数据）

Storm常用于在线的实时的大数据处理。

猜你喜欢

转载自blog.csdn.net/cjDaShuJu_Java/article/details/80020619

Hadoop，Spark和Storm三大分布式计算系统简介及比较

Hadoop、Storm和Spark主流分布式系统特点和应用场景

本文将介绍“数据计算”环节中常用的三种分布式计算组件——Hadoop、Storm以及Spark。

spark三大弹性分布式数据集比较

类Hadoop的高效分布式计算系统Spark

大数据分布式计算组件：Hadoop丨Storm丨Spark

分布式计算hadoop三大组件

分布式计算Hadoop简介

大数据计算架构Hadoop、Spark和Storm 三者技术比较

从Storm和Spark 学习流式实时分布式计算的设计

Hadoop、Storm和Spark 三者的区别、比较

matlab计算三大分布

2.1.1 hadoop体系之离线计算-hdfs分布式文件系统-hadoop简介

Hadoop Storm Spark比较

Hadoop、storm和Spark的区别、比较

分布式系列之分布式实时计算系统Storm解析

【Hadoop】谷歌的三篇论文（GFS、MapReduce分布式计算模型、BigTable大表）

分布式系统hadoop、hbase、hive、spark架构原理

hadoop、hbase、hive、spark分布式系统架构原理

【分布式】流式计算Storm框架

Storm：分布式流式计算框架

Hadoop简介(分布式系统基础架构)

Hadoop分布式文件系统——HDFS原理简介

搭建hadoop和spark分布式环境

分布式-HADOOP三大组件技术概要

分布式计算开源框架Hadoop入门实践（三）

Hadoop 系列（三）—— 分布式计算框架 MapReduce

大数据架构Hadoop、Spark和Storm 三者技术比较

Hadoop、Storm、Spark的区别与比较

分布式系统简介

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)