kafka手动维护偏移量 - 代码天地

kafka手动维护偏移量

其他 2019-12-24 09:50:48 阅读次数: 0

1、kafka手动维护偏移量

　　在项目中，kafka和sparkStream采用的是直连方式，使用的是kafka基础的api，因此需要手动维护偏移量。将偏移量保存在mysql中。

　　程序运行时，先去mysql中查询偏移量，判断是否是程序第一次启动，若是第一次启动，就是不指定偏移量，重头读取kafka数据。若是非第一次启动，即从mysql中有偏移量。此时还要对比数据库中的偏移量和kafka现在每个分区的最早偏移量getEarliestLeaderOffsets，因为kafka数据默认是保存七天，也就是偏移量有效期就是七天。若数据库中的偏移量没过期，那就从数据库保存的偏移量开始读。若过期了，那就从现在最新的开始读。

这里出现一个问题，kafka的分区数不一定不变，有时候就是为了提升spark Streaming的并行处理的能力，这时要必须增加kafka的分区数以对应spark Streaming的executor数，--num- executor这个主要设置即可，因为分区数要等于executor的数量，大了小了都不好。而新增分区的偏移量若没有及时保存在数据库上的话，就会出现数据丢失，消费不到新增分区的数据。

这里的解决方式，就是每次启动流程序前，对比一下当前我们自己保存的kafka的分区的个数和从zookeeper里面的存的topic的分区个数是否一致，如果不一致，就把新增的分区给添加到我们自己保存的信息中，并发偏移量初始化成0，这样以来在程序启动后，就会自动识别新增分区的数据。

参考博客：Kafka偏移量维护中的坑 https://www.jianshu.com/p/316e50a570dd

猜你喜欢

转载自www.cnblogs.com/guoyu1/p/12089696.html

kafka javaAPI 手动维护偏移量

kafka手动维护偏移量

Kafka手动维护偏移量（offset）

Spark on Kafka Receiver 和 Direct Kafka手动维护偏移量

Spark -- spark on kafka Receiver & Direct Kafka手动维护偏移量

SparkStreaming消费Kafka数据手动提交偏移量维护在自定义环境的方式

kafka实践一：手动修改消费偏移量的2种方式

Kafka的assign和subscribe订阅模式和手动提交偏移量

kafka生成avro格式数据，sparkstreaming消费avro格式，且手动维护偏移量保存到mysql中

【弄nèng - Kafka】应用篇（四） —— Springboot整合Kafka（自动，手动提交偏移量）

Kafka 消息偏移量的维护

为什么kafka 需要 subscribe 的 group.id？我们是否需要使用 commitSync 手动提交偏移量？

Java 版spark Streaming 维护kafka 的偏移量

Kafka - 偏移量提交

Kafka 偏移量的演变

Flink手动维护kafka的offset

Spark Streaming管理Kafka偏移量

使用redis存储kafka的偏移量

Kafka-提交偏移量（offset）

Kafka偏移量(Offset)管理

Kafka——Consumer提交偏移量

kafka 偏移量的类型与提交方式

【Kafka】《Kafka权威指南》——提交和偏移量

Kafka学习笔记（五、Kafka偏移量）

【Kafka】Kafka 修改某个消费组的偏移量

关于偏移量

kafka重置到最新offset偏移量

如何管理Spark Streaming消费Kafka的偏移量（三）

如何管理Spark Streaming消费Kafka的偏移量（二）

如何管理Spark Streaming消费Kafka的偏移量（一）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)