kafka消费延迟或者重复消费原因 - 代码天地

kafka消费延迟或者重复消费原因

编程语言 2019-03-23 19:50:53 阅读次数: 0

简介

由于项目中需要使用kafka作为消息队列，并且项目是基于spring-boot来进行构建的，所以项目采用了spring-kafka作为原生kafka的一个扩展库进行使用。先说明一下版本：

spring-boot 的版本是1.4.0.RELEASE
kafka 的版本是0.9.0.x 版本
spring-kafka 的版本是1.0.3.RELEASE

用过kafka的人都知道，对于使用kafka来说，producer的使用相对简单一些，只需要把数据按照指定的格式发送给kafka中某一个topic就可以了。本文主要是针对spring-kafka的consumer端上的使用进行简单一些分析和总结。

kafka的速度是很快，所以一般来说producer的生产消息的逻辑速度都会比consumer的消费消息的逻辑速度快。

具体案例

之前在项目中遇到了一个案例是，consumer消费一条数据平均需要200ms的时间，并且在某个时刻，producer会在短时间内产生大量的数据丢进kafka的broker里面（假设平均1s中内丢入了5w条需要消费的消息，这个情况会持续几分钟）。

对于这种情况，kafka的consumer的行为会是：

kafka的consumer会从broker里面取出一批数据，�给消费线程进行消费。
由于取出的一批消息数量太大，consumer在session.timeout.ms时间之内没有消费完成
consumer coordinator 会由于没有接受到心跳而挂掉，并且出现一些日志
日志的意思大概是coordinator挂掉了，然后自动提交offset失败，然后重新分配partition给客户端
由于自动提交offset失败，导致重新分配了partition的客户端又重新消费之前的一批数据
接着consumer重新消费，又出现了消费超时，无限循环下去。

解决方案

遇到了这个问题之后，我们做了一些步骤：

提高了partition的数量，从而提高了consumer的并行能力，从而提高数据的消费能力
对于单partition的消费线程，增加了一个固定长度的阻塞队列和工作线程池进一步提高并行消费的能力
由于使用了spring-kafka，则把kafka-client的enable.auto.commit设置成了false，表示禁止kafka-client自动提交offset，因为就是之前的自动提交失败，导致offset永远没更新，从而转向使用spring-kafka的offset提交机制。并且spring-kafka提供了多种提交策略：
这些策略保证了在一批消息没有完成消费的情况下，也能提交offset，从而避免了完全提交不上而导致永远重复消费的问题。

分析

那么问题来了，为什么spring-kafka的提交offset的策略能够解决spring-kafka的auto-commit的带来的重复消费的问题呢？下面通过分析spring-kafka的关键源码来解析这个问题。

首先来看看spring-kafka的消费线程逻辑

上面可以看到，如果auto.commit关掉的话，spring-kafka会启动一个invoker，这个invoker的目的就是启动一个线程去消费数据，他消费的数据不是直接从kafka里面直接取的，那么他消费的数据从哪里来呢？他是从一个spring-kafka自己创建的阻塞队列里面取的。
然后会进入一个循环，从源代码中可以看到如果auto.commit被关掉的话，他会先把之前处理过的数据先进行提交offset，然后再去从kafka里面取数据。
然后把取到的数据丢给上面提到的阻塞列队，由上面创建的线程去消费，并且如果阻塞队列满了导致取到的数据塞不进去的话，spring-kafka会调用kafka的pause方法，则consumer会停止从kafka里面继续再拿数据。
接着spring-kafka还会处理一些异常的情况，比如失败之后是不是需要commit offset这样的逻辑。

方法二

可以根据消费者的消费速度对session.timeout.ms的时间进行设置，适当延长
或者减少每次从partition里面捞取的数据分片的大小，提高消费者的消费速度。

参考链接：https://www.jianshu.com/p/4e00dff97f39

猜你喜欢

转载自blog.csdn.net/jerry010101/article/details/88766707

kafka消费延迟或者重复消费原因

***实现Kafka完全不重复消费或者丢失消费

kafka重复消费问题

RabbitMQ延迟消费和重复消费

kafka消费延迟问题查找

kafka生产消费失败的原因

kafka-重复消费-2

Kafka常见的导致重复消费原因和解决方案

kafka重复消费问题--consumer消费能力很低

Kafka丢数据、重复消费、顺序消费的问题

kafka消费能力低下原因思考

kafka丢失和重复消费数据

kafka一直重复消费消息

kafka：一直重复消费消息

Kafka重复消费，不丢失数据

kafka重复消费和数据丢失问题

Springboot集成Kafka rebalanced重复消费问题

kafka 重启consumer 重复消费问题

SparkStreaming踩坑之Kafka重复消费

kafka是如何保证消息不被重复消费的

开发技术-解决kafka消息重复消费

Kafka重复消费场景及解决方案

Kafka消费

Kafka入门，漏消费和重复消费，消费者事务，数据积压（二十四）

Kafka OffsetMonitor：监控消费者和延迟的队列

平台搭建---Kafka使用---Kafka重复消费和丢失数据

Kafka学习---4、消费者（分区消费、分区平衡策略、offset、漏消费和重复消费）

【kafka】消费组消费主题

RocketMQ 延迟消费原理

如何保证消息不被重复消费？或者说，如何保证消息消费的幂等性？

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)