Storm排错调优之Worker重启 - 代码天地

Storm排错调优之Worker重启

其他 2018-12-14 20:23:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Simon_09010817/article/details/81738916

Storm排错调优之Worker重启

在storm运行log中可以看到worker.log日志显示shutting down xxxworker。

在相同的时间点位于storm运行日志中的supervisor.log显示kill xxx ，xxx就是对应的workerid

从而可以断定是supervisor重启了worker。

然而supervisor为何重启worker，默认supervisor和worker之间的心跳时间是30000ms，

而运行过程中心跳远大于这一值。

所以导致重启。

但是为何supervisor和worker之间的心跳时间会如此之长，查看zookeeper的运行日志显示，

在同一时间点有几台zookeeper shutdown 和goodBye。

而且均显示Too Many Connections from xxx --max is 60。

Zk日志中均显示Unable to read additional data from client sessionid 0x664b3c031710068, likely client has closed socket

由此猜测是否是zookeeper最大客户端连接数为60，实际运行中和zk交互的远不止60个，导致部分connection等待，

也就是supervisor等待。等到时间超过supervisor和worker之间通信时间30000ms,最终导致HB心跳监测不到认为worker挂掉并重启worker。

解决：

将zk与supervisor分离，在supervisor机器上不安装zk.
将zk的最大连接数设置为0（不限制最大连接数），而不是默认的60

在zoo.cgf中设置maxClientCnxns = 60

3.（重要）加大supervisor和worker之间HB心跳时间为60

在storm.yaml中设置supervisor.worker.timeout.secs

猜你喜欢

转载自blog.csdn.net/Simon_09010817/article/details/81738916

Storm排错调优之Worker重启

Storm排错调优之SessionTimeout

Storm排错调优之Spout拉取造成内存溢出（OOM）

线上Storm的worker，executor，task参数调优篇

异常导致 Storm Worker 重启

nginx主配置调优之worker_processes

nginx主配置调优之worker_priority

storm worker异常重启原因排查汇总

storm并行度调优

nginx主配置调优之将worker进程与cpu绑定。

Spark调优之性能调优

Spark调优之JVM调优

Spark调优之Shuffle调优

spark调优之开发调优

性能调优之Weblogic调优

性能调优之 Weblogic 调优

SQL 调优之查询调优

SQL调优之性能调优

sparkSQL之调优

Storm Worker端口冲突

Storm Worker中的线程

Storm环境配置及吞吐量测试调优总结

jvm 调优之jstat

Mysql之explain调优

mysql调优之小结

java之JVM调优

LAMP之Apache调优

jvm调优之jstat

jvm调优之jstack

jvm调优之jps

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)