Storm单词技术案例 - 代码天地

Storm单词技术案例

其他 2018-12-22 03:12:17 阅读次数: 0

功能说明：

设计一个topology，来实现对文档里面的单词出现的频率进行统计

整个totopolgy分为三个部分：

1. RandomSentenceSpout：数据源，在已知的英文句子中，随机发送一条句子出去。

2. SplitSentenceBolt : 负责将单行文本记录（句子）切分为单词.

3. WordcountBolt ：负责对单词的频率进行累加

7.6、Stream Grouping详解

Storm里面有7种类型的stream grouping

Shuffle Grouping: 随机分组，随机派发stream里面的tuple，保证每个bolt接收到的tuple数目大致相同。
Fields Grouping：按字段分组，比如按userid来分组，具有同样userid的tuple会被分到相同的Bolts里的一个task，而不同的userid则会被分配到不同的bolts里的task。
All Grouping：广播发送，对于每一个tuple，所有的bolts都会收到。
Global Grouping：全局分组，这个tuple被分配到storm中的一个bolt的其中一个task。再具体一点就是分配给id值最低的那个task。
Non Grouping：不分组，这stream grouping个分组的意思是说stream不关心到底谁会收到它的tuple。目前这种分组和Shuffle grouping是一样的效果， 有一点不同的是storm会把这个bolt放到这个bolt的订阅者同一个线程里面去执行。
Direct Grouping：直接分组，这是一种比较特别的分组方法，用这种分组意味着消息的发送者指定由消息接收者的哪个task处理这个消息。只有被声明为Direct Stream的消息流可以声明这种分组方法。而且这种消息tuple必须使用emitDirect方法来发射。消息处理者可以通过TopologyContext来获取处理它的消息的task的id （OutputCollector.emit方法也会返回task的id）。
Local or shuffle grouping：如果目标bolt有一个或者多个task在同一个工作进程中，tuple将会被随机发生给这些tasks。否则，和普通的Shuffle Grouping行为一致。

猜你喜欢

转载自blog.csdn.net/abcdefghwelcome/article/details/85056342

Storm单词技术案例

Storm单词技术案例（重点）

Storm实现单词统计案例

Storm安装以及单词统计案例二

2.Storm集群部署及单词统计案例

大数据学习——Storm学习单词计数案例

Storm实现单词统计

大数据之storm（一） --- storm简介，核心组件，工作流程，安装和部署，电话通信案例分析，集群运行，单词统计案例分析，调整并发度

storm两个案例(1单词计数本地执行 2累加集群执行 3集群关闭storm任务写法)

Storm案例实战

（03）Storm编程案例

Storm怎么完成对单词的计数？

利用storm实现简单的单词统计

storm学习篇（二）—— 单词计数实例

Storm集群部署与单词计数程序

Storm-wordcount实时统计单词次数

Storm 流计算实现wordcount(单词统计)

Storm流处理项目案例

集群执行storm自带案例

Storm案例之词频统计

单词统计案例

Storm的体系结构介绍以及Storm入门案例

storm本地执行案例1--->累加

流式计算storm核心组件、特性、案例

Storm案例之自增数字求和

大数据014——Storm 简介及入门案例

大数据014——Storm 集群及入门案例

（04）Storm与Kafka结合使用简单案例

Kafka、Flume、Storm 结合学习案例

Storm 1.2 单词计算topology的数据流

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)