ZAB——Paxos到Zookeeper(一)

简介

  • ZAB(Zookeeper Atomic BroadCast)协议。
  • 为zk专门设计的支持崩溃恢复原子广播协议。
  • zk使用zab协议在主备模式的架构中保持集群各副本数据的一致性

崩溃恢复模式

条件

  • 服务框架重启。
  • Leader异常:网络中断、崩溃退出、重启。

目的

  • 选取新Leader。
  • Follower和Leader数据同步。
    • 已经被Leader提交的Proposal能够被所有Follower提交。
    • 跳过已经被丢弃事务的Proposal。

步骤

ZXID:事务ID,共64位,32位epoch标识leader周期,32位标识事务编号

  1. Leader选举。Leader选举为提出Proposal中最大ZXID的机器,对epoch+1。
  2. Leader以Proposal紧接着Commit消息的形式同步数据给Follower。
  3. 包含上一个leader周期未提交Proposal的Follower启动时,会被Leader要求回退到过半机器提交的最新Proposal。

消息广播模式

条件

  • 过半Follower完成和Leader的状态同步。

目的

  • 主备数据一致性。
    • 两阶段提交移除回滚逻辑。
    • 基于FIFO的TCP,保证消息接收和发送的顺序性。

步骤

  • ZAB——Paxos到Zookeeper(一)
  1. Leader为每个事务请求生成Proposal,分配ZXID。
  2. Leader广播Proposal。
  3. Follower事务日志落盘,返回Ack。
  4. Leader收到超过半数Follower的Ack后,广播Commit消息通知提交。
  5. Leader自身提交。
  6. Follower收到Commit消息之后提交。

和Paxos的关系

相同

  • Leader协调多个Follower。
  • Leader等待超过半数Follower反馈后提交。
  • 每个Proposal包含一个epoch值,标识当前的Leader周期。

不同

  • 目的不同。
    • ZAB:构建高可用分布式主备系统。
    • Paxos:构建分布式一致性状态机系统。