ZooKeeper全局锁WriteLock选举的BUG - 代码天地

ZooKeeper全局锁WriteLock选举的BUG

企业开发 2018-05-14 17:43:57 阅读次数: 2

最近项目中采用ZK去选择分布式集群的Master/Slave，生产环境运行一段时间中，经常出现同时存在多个Master的问题，然后去阅读了一下ZK扩展包的源码，发现两个BUG：

BUG：多机器同时获取WriteLock全局锁时有可能会有多个机器成为Leader。

原因分析：WriteLock创建临时自增节点是采用x-session_id-sequece_no的方式，在选举Leader时，通过TreeSet对节点进行排序，最小的节点就会被选为Leader，其它的会被选为Follower。由于ZNodeName的compareTo方法的实现问题，WriteLock获取的锁时并不是按sequence_no最小的来选择，而是先根据session_id的字符串进行比较，再比较sequence_no，如果WriteLock后创建的节点的session_id比前面的小（可能性比较大），这种比较方式就有可能导致产生多个Leader。如：

机器1创建了：x-231622919316419832-0000000183

机器2创建了：x-231622919316419833-0000000184

机器3创建了：x-87556941509467773-0000000185

机器4创建了：x-159565318739768636-0000000186

由于机器1最先启动，只有一个节点生成，所以理所当然成为Leader，但由于ZNodeName的compareTo方法的问题，机器4启动后发现session_id值比当前Leader的值要小，所以机器4也被认为是Leader，这样就同时存在了两个Leader。

另外，不仅在机器启动和重启的时候发生，ZK会话超时重连，而会出现此情况。

如何改造：

去除ZNodeName的compareTo方法对session_id的比较，仅保留对sequece_no的比较。

猜你喜欢

转载自carver.iteye.com/blog/1569572

ZooKeeper全局锁WriteLock选举的BUG

zookeeper的使用及集群搭建、监听、选举、锁

Zookeeper：基于Zookeeper的分布式锁与领导选举

zookeeper选举

zookeeper 选举

zookeeper Master选举和分布式锁

基于zookeeper实现领导选举和分布式锁

基于Zookeeper的分布式锁与领导选举（转）

Zookeeper-Zookeeper leader选举

Apache ZooKeeper :ZooKeeper选举机制

Zookeeper Leader选举

ZooKeeper 选举过程

Zookeeper选举原理

Zookeeper Leader选举分析

zookeeper核心原理（选举）

zookeeper的选举机制

zookeeper 、kafka leader选举

zookeeper选举简单流程？

Zookeeper之Leader选举

zookeeper选举机制

Zookeeper的Leader选举

zookeeper 实现master选举

zookeeper 选举和同步

zookeeper中的选举机制

ZooKeeper 工作、选举原理

zookeeper选举算法

zookeeper中的leader选举

Zookeeper选举机制测试

Zookeeper搭建及选举验证

Zookeeper master选举

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)