Raft 共识算法( 二 )

  • 投票给自己
  • 重置选举定时器
  • 发送RequestVote RPC给所有其他server
  • 如果接收到大多数server的投票:成为leader
  • 如果接收到新leader发出的AppendEntries RPC:成为follower
  • 如果举定时器超时:开始新一轮选举
  • leader
    • 一旦成为领导人:发送第一个AppendEntries RPC(心跳)给每一个server;空闲时间重复发送防止选举定时器超时
    • 如果接收到客户端的命令:添加记录到本地日志后面,在完全应用到状态机后再响应客户端
    • 如果最新的记录索引 >= 某个follower的nextIndex:发送AppendEntries RPC,包含了从nextIndex开始的记录
      • 如果成功:更新follower的nextIndex和matchIndex
      • 如果因为日志不一致导致的失败:自减nextIndex并重试
    • 如果存在N > commitIndex,大多数的matchIndex[i] ≥ N并且log[N].term == currentTerm:设置commitIndex = N
  • 算法不变量
    • Election Safety:每个任期足以多只有一个leader被选举出来
    • Leader Append-Only:leader不会覆盖或者删除自己的日志的记录;他只会在后面添加新的记录
    • Log Matching:如果两个日志包含一个相同索引和任期的记录,那么我们认为这个索引的记录以及之前的记录的内容完全一致
    • Leader Completeness:如果一个记录在一个任期内被提交,那么更高任期的leader的日志都会包含这个记录
    • State Machine Safety:如果一个server应用了一个给定索引的记录到状态机,不存在其他server在相同的索引位置应用不同的记录
    参考:https://github.com/maemual/raft-zh_cn

    经验总结扩展阅读