大数据（Storm）-简介

其他 2018-06-03 06:07:45 阅读次数: 1

什么是Storm

Strom是一个老牌的实时数据处理框架，在Spark Streaming流行前，Storm统治者整个流式计算的江湖。

更详细的说，Storm是一个实时数据处理框架，具有低延迟/高可用/易扩展/数据不丢失等特点，同时，Storm还提供流类似与MapReduce的简单编程模型，便于开发。

Storm与Hadoop的区别

Storm与Hadoop可以说是数据处理中两种极端场景下的不同解决方案，主要区别有：

Storm用于实时计算，Hadoop用于离线计算
Storm将处理的数据保存在内存中，Hadoop则保存在HDFS上
Storm通过网络传输数据，Hadoop将中间数据保存在磁盘上

Storm的使用场景

实时监控与日志分析
管道系统
消息转换

Strom的核心组件

这里写图片描述

Nimbus：负责资源分配和任务调度
Supervisor：负责接收Nimbus分配的任务，启动和停止属于自己的Worker进程
Worker：运行具体的处理逻辑的进程，Work运行的任务种类只有两种，一种是Spout任务，一种是Blot任务
Task：Work中的每个Spout/Blot任务都是一个线程，这个线程就是Task。但在0.8版本以后，一个task不再对应一个物理线程，有可能不同但Task共享同一个线程。

Storm编程模型

这里写图片描述

Topology：Storm中一个独立的实时计算应用但名称；
Spout：在一个Toplogy中获源数据流的组件；
Bolt：接收数据并进行处理的组件，可以在其中定义处理逻辑；
Tuple：Storm中消息的基本单元，在Spout/Blot之间传递的每条消息就是一个Tuple；
Stream：表示数据的流向，也可以理解为tuple流转流程

流式计算一般架构

网络系统<-Flume集群<-Kafka集群<-Storm集群<-Redis集群

Flume用来采集数据
Kafka用来临时保存数据
Storm用来实时计算数据
Redis作为内存数据库保存最终数据

猜你喜欢

转载自blog.csdn.net/zhangdong2012/article/details/80101202

大数据（Storm）-简介

大数据的实时处理STORM简介

大数据014——Storm 简介及入门案例

大数据（Storm）-原理

大数据（Storm）-WordCount

大数据（Storm）-安装

大数据------storm

大数据-Storm

大数据框架Storm的介绍

大数据之storm学习

Storm入门教程玩转大数据计算之Storm

【大数据----Storm】Storm原理、环境搭建、应用

大数据（六十三）Storm【Storm介绍】

【大数据Storm系列】Storm教程：详细全部

大数据之storm（一） --- storm简介，核心组件，工作流程，安装和部署，电话通信案例分析，集群运行，单词统计案例分析，调整并发度

Storm简介——初始Storm

Storm storm简介(一)

大数据学习之（Storm）-原理详解！

“大数据” Hadoop，Spark和Storm

大数据” Hadoop，Spark和Storm

大数据系列7：Storm – 流计算

使用 Twitter Storm 处理实时的大数据

大数据Spark与Storm技术选型

大数据-------storm集群搭建与任务处理

大数据Storm企业项目教程视频

大数据学习：storm流式计算

15.大数据学习之旅——Storm

大数据之Storm介绍及原理

大数据思维导图（六）--Storm

大数据014——Storm 集群及入门案例

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)