spark多个kafka source采用同一个group id导致的消费堆积延迟 - 代码天地

spark多个kafka source采用同一个group id导致的消费堆积延迟

其他 2020-01-25 10:21:53 阅读次数: 0

Kafka版本0.10.0

spark版本 2.1

Spark streaming在同一个application中多个kafka source当使用一个group id的时候订阅不同topic会存在消息消费堆积，并且控制页面streaming时间会存在严重延时。

在spark根据存在的输出流依次生成job的时候，将会依次串行调用各个kafka source的compute()方法从kafka中拉取信息，在准备拉取消息之前，如果当前消费者没有加入到kafka中，将会发出join请求到kafka中尝试加入，尝试加入请求操作将会导致该kafka对这个消费者组进行rebanance操作（同步），可能会导致长时间的阻塞。

当多个流使用同一个groupid订阅不同topic之后，一段时间之后，其中一个消费者metadata中的消费者组总订阅情况将会更新，导致其在下一次拉取数据的时候会重新发起join请求导致rebalance阻塞，而其他的消费者的心跳消息接收由于超时而也从消费者组中被踢出而准备重新进入。

以上一个重要的地方在于，在job生成阶段，source是串行从kafka拉取消息的，join请求同一时间只会有一个消费者发出，此处的阻塞将会直接导致其他消费者的心跳超时而准备重新加入，当前一个消费者终于完成join操作并拉取到消息，下一份source才会进入拉取阶段，而由于前一个消费者的阻塞，其已经不在当前消费者组中，将会重新发起join请求加入，此处的阻塞导致前一个消费者的超时而重新被踢出，如此恶性循环，每个消费者尝试拉取消息的时候都会发生rebalance阻塞并引起整体的消费堆积，由于阻塞之处在拉取消息之前，在spark页面将无法看到具体的deplay信息，整体消息获取阻塞导致内部时间累加器时间计算滞后，spark页面上展示的时间批次滞后。

tydhot

发布了141 篇原创文章 · 获赞 19 · 访问量 10万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_40318210/article/details/102577800

spark多个kafka source采用同一个group id导致的消费堆积延迟

Kafka多个消费者监听消费同一个Topic主题

删除同一个IMGAE ID的多个镜像

kafka测试同一个消费组的多个消费者负载均衡实例（集成spring）

关于同一进程配置多个groupId消费同一个Topic的问题

kafka消费者重复消费同一个topic

多个消费者监听同一个队列

同一个tomcat部署多个项目导致启动失败

MapReduce计算同一个订单ID的最大金额数--加深group的印象

简记kafka group id相同导致的不同consumers启动后不消费和延时消费问题

Easyui-tabs延迟加载：同一个界面嵌套多个Tab，点击/选中后才执行加载

spring集成kafka，实现一个topic可以被多个group消费

kafka 一个topic 被多个group.id 自动创建

【Flink】Flink 单个任务多个流的消费同一个topic的时候其中一个流卡死不消费

同一个页面的多个ligerGrid共用同一个方法

spark streaming kafka消费多个topic时不执行的问题

Spark：同一个程序使用多个hive元数据

Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二十五）Structured Streaming：同一个topic中包含一组数据的多个部分，按照key它们拼接为一条记录（以及遇到的问题）。

同一个Tomcat部署多个项目

同一个页面多个Ueditor如何取值

同一个页面使用多个版本的jQuery

idea同一个窗口打开多个项目

多个对象绑定同一个事件

同一个windows server 部署多个tomcat

Nginx同一个域名配置多个项目

多个装饰器装饰同一个函数

WinccFlexible 同一个项目创建多个connections

IDEA同一个工程启动多个实例

同一个tomcat下，跑多个项目

php：多个页面调用同一个导航

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)