Raft¶

Abstract

Raft 是一种复制状态机协议，一个复制服务通过多个副本 server 上存储其状态（数据）的完整副本来实现容错，复制使其即使部分 server 出现故障（崩溃或网络中断、不稳定），服务仍能继续运行，但问题在于，故障可能导致各个副本保存的数据不一致；
Raft 将 client requests 组织成一个序列（日志），并确保所有副本 servers 都能看到相同的日志。每个副本按照日志的顺序执行 client requests，将其应用于服务状态的本地副本；
由于所有正常运行的副本都能看到相同的日志内容，它们都会以相同顺序执行相同的 requests，从而保持一致性服务状态；
如果某个 server 发生故障但之后恢复，Raft 会负责使其日志更新到最新状态；
只要至少大多数 server 处于活跃状态且能够相互通信，Raft 就会继续运行；
Raft 只能满足 CAP 理论中的 CP；
paper: In Search of an Understandable Consensus Algorithm
home: https://pdos.csail.mit.edu/6.824/labs/lab-raft1.html
Students' Guide to Raft
Visualization of Raft

Lab Materials

Part 3A: leader election¶

leader election

实现 Raft 的 leader 选举和 heartbeats 机制（不带日志条目的 AppendEntries RPC）；
目标是选举出一个单一的 leader，在没有故障的情况下该 leader 保持其地位，并且当旧 leader 发生故障或旧 leader 之间的数据包丢失时，有新 leader 接管；

单个 raft 节点、RequestVote RPC、AppendEntries RPC 的各个变量需完全遵循 paper 里的图2！
每个 raft 节点可以是 leader | candidate | follower，都可以发送和接收 RPC，维护唯一一个运行的 goroutine；
每个 raft 节点都有一个选举定时器，每次收到 heartbeat 或 log 的 RPC 时，都会重置选举定时器，发送者是 leader，接收者是 follwer，一旦选举定时器超时，节点转化为 candidate 并进行投票选举；

ticker()：运行在每个节点上，判断是否需要投票。

Tip

若投票超半数，则当选 leader 并广播给其他节点，否则重新一轮选举；
避免脑裂：每个 candidate 都给自己投票，如果只有两个 follower 并且转化成 candidate 发起选举，都给自己投一票，就会形成脑裂，解决办法就是随机设置选举定时器的超时时间，至少超过 leader 的心跳间隔；
心跳机制和发起投票是并行的，即使当前 candidate 正在选举，一旦选举计时器出发，应该开始另一次选举，避免 RPC 延迟或丢失；

leader 在任期期间，会不间断地发送心跳给所有 follower，防止触发超时选举；

和 AppendEntries() RPC 相同，只是参数为空，表示发送心跳；

AppendEntries()：接收来自 leader 的追加条目，当前 Part 3A 不涉及日志相关，所以只更新一些参数变更如 term、心跳时间戳等；

log

Solve

persistence

Solve

log compaction

Solve