ZAB 算法

ZAB (Zookeeper Atomic Broadcast )  zookeeper原子消息广播协议

  保证:分布式数据一致性 

  所有事务请求必须由一个全局唯一的服务器来协调处理,这样的服务器被称为Leader服务器,而余下的其它服务器则称为Follower服务器。Leader 服务器负责将一个客户端请求转换成一个事务Proposal(提议),并将该Proposal分发给集群中所有的Follower服务器。之后Leader 服务器需要等待所有 Follower 服务器的反馈,一旦超过半数的 Follower 服务器进行了正确的反馈后, 那么 Leader 就会再次向所有的 Follower 服务器分发 Commit 消息,要求其将前一个 Proposal 进行提交。

一、消息广播

  类似于2PC,针对客户端的事务请求,Leader 服务器会为其生成对应的事务 Proposal ,该Proposal 对应一个全局单调递增的唯一ID (事务ID,ZXID,用于确保顺序性), 并将其发送给集群中其余的所有机器,然后再分别收集各自的选票,最后进行事务的提交。

  保证事务顺序性的具体做法:Leader 服务器会为每一个 Follower 服务器都分配一个单独的队列,然后将需要广播的事务 Proposal 依次放入队列中,再根据FIFO策略进行消息的发送。

  Follower 服务器接收到消息后,将消息写入事务日志中,在成功写入后给 Leader 服务器发送 Ack 回应。

  当Ack 回应过半后, Leader 服务器再发送 Commit 消息给所有的 Follower 。

  Follower 服务器接收到Commit 请求后,完成事务的提交。

二、崩溃恢复

  Leader 崩溃后,将从 Follower 中选取 ZXID 最大的作为新的 Leader 。(原因为:ZXID最大,说明事务最新,最齐全。称为 Leader 后,不需要进行额外的同步操作。)

  数据同步:

    在新的Leader选举完成后,需要将所有的Follower服务器同步至Leader的状态,才开始接收处理请求。

  ZXID:

    1、总共 64 位

    2、低 32 位,仅简单的递增。(新的请求累加1)

    3、高 32 位,根据最大的ZXID进行计算+1。(每次更换新的Leader 才会变动,且将低32位置0。)

      当旧的Leader 恢复后,加入到新的集群时,对比高32位的值,谁高谁做主。因此将旧的Leader作为新的Leader的Follower,同步至新的Leader的状态,然后加入集群接收请求处理。

三、ZAB 与 Paxos 对比

  ZAB 的发现阶段,确定那个Follower 为Leader时,会根据最大的ZXID确保新的Leader是当前最新最全的事务服务器。而Paxos没有这一步,它先随机选取一个Follower作为Leader,然后再收集所有的Follower事务获取最新的状态,完成自身的同步,再完成Follower的同步。

猜你喜欢

转载自www.cnblogs.com/chen--biao/p/10087770.html
ZAB