storm中supervisor, task, worker, spout, bolt之间的关系 - 代码天地

storm中supervisor, task, worker, spout, bolt之间的关系

企业开发 2018-05-13 18:46:12 阅读次数: 0

一个storm topology运行起来之后, 会在supervisor 机器上启动一些进程来运行spout和bolt实例.

如果一个topology里面一共有一个spout, 一个bolt。其中spout的parallelism是2, bolt的parallelism是4, 那么我们可以把这个topology的总工作量看成是6，那么一共有6个task，那么/tasks/{topology-id}下面一共会有6个以task-id命名的文件，其中两个文件的内容是spout的id, 其它四个文件的内容是bolt的id。

task->node+port, 它其实就是从task-id到supervisor-id+port的映射，也就是把这个task分配给某台机器的某个端口来做。

topology里面的组件(spout/bolt)都根据parallelism被分成多个task, 而这些task被分配给supervisor的多个worker来执行。

task都会跟一个componment-id关联, componment是spout和bolt的一个统称.

对于每一个component在部署的时候都会指定使用的数量, 在storm-user中有一个讨论说明了这个问题:
里面的大意是说, 通过设置parallelism来指定执行spout/bolt的线程数量. 而在配置中还有另外一个地方(backtype.storm.Config.setNumWorkers(int))来指定一个storm集群中执行topolgy的进程数量, 所有的线程将在这些指定的worker进程中运行. 比如说一个topology中要启动300个线程来运行spout/bolt, 而指定的worker进程数量是60个, 那么storm将会给每个worker分配5个线程来跑spout/bolt, 如果要对一个topology进行调优, 可以调整worker数量和spout/bolt的parallelism数量(调整参数之后要记得重新部署topology. 后续会为该操作提供一个swapping的功能来减小重新部署的时间).

对于worker和task之间的比例, nathan也给出了参考, 即1个worker包含10~15个左右, 当然这个参考, 实际情况还是要根据配置和测试情况

参考:
http://xumingming.sinaapp.com/category/storm/

猜你喜欢

转载自macrochen.iteye.com/blog/1439469

storm中supervisor, task, worker, spout, bolt之间的关系

Storm中Worker、Executor、Task关系

storm源码之理解Storm中Worker、Executor、Task关系

storm笔记 spout和bolt

storm 多spout和bolt

Storm中的worker Executor Task

storm 如何编写可靠的spout和bolt

聊聊storm worker的executor与task

Storm的并行度详解 Strom Topology执行分析：worker数，Bolt实例数，executor数，task数

Storm Spout nextTuple策略

Storm 1.1 Storm topology的组成部分—stream、spout和bolt

Storm的可靠性如何实现？包括spout和bolt两部分

8.3.0Storm流之一个Spout分发多个Bolt

storm UI没有topology stats没有spout与bolt的stats

storm: storm-kafka spout

线上Storm的worker，executor，task参数调优篇

聊聊storm trident spout的_maxTransactionActive

Strom: mongdb spout /bolt trending topics

JStorm源代码阅读-bolt/spout的执行

Storm Worker中的线程

Storm中Spout使用注意事项小结

android中task、activity、apk之间的关系图

Spark中Executor、Task和Container之间的关系

Storm Worker端口冲突

storm trident 事务和 spout和state有关

Spark任务中如何确定park分区数、task数目、core数、worker节点个数、excutor数量

任务中如何确定spark分区数、task数目、core个数、worker节点个数、excutor数量

Spark：任务中如何确定spark分区数、task数目、core个数、worker节点个数、excutor数量

Spark中master、worker、executor和driver的关系

异常导致 Storm Worker 重启

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)