作者:曾家宏惠茹冠宇 | 来源:互联网 | 2023-08-31 20:10
前置知识
CFT与BFT的区别
- CFT:节点出现故障( crash 或 fail-stop),即不响应但不会伪造信息的情况称为“非拜占庭错误”( non-byzantine fault)或“故障错误”( Crash
Fault),处理非拜占庭错误的算法有:paxos、raft和其变种; - BFT:节点伪造信息恶意响应的情况称为“拜占庭错误”( Byzantine Fault),对应节点为拜占庭节点。处理拜占庭错误算法有:pbft、hotstuff算法;
同步、异步、部分同步概念
- 异步(asynchrony):系统中各个节点可能存在较大的时钟误差、消息传递时间是任意长的,各节点对 消息的处理时间也可能是任意长的。
- 同步(synchrony):系统中各个节点的时钟误差存在上限、消息传递在一定时间内完成,各节点完成处 理消息的时间是一定的。
- 部分同步(partial synchrony):在一个全局稳定时间(GST)之前,系统可能处于异步状态,GST之后,会有一段同步的状态。
与公有链共识算法的区别
公有区块链不可能同时共识区块1和区块2,但在pbft中,交易1和交易2的共识是并行的。
-
在公有区块链中,每一个区块串行进行共识,共识的对象是区块,区块包含一段时间收集的交易
-
在pbft中,共识的对象是每一个交易(可以说在pbft中没有区块这个概念),交易共识的过程是并行(限定在高低水位,后续解释)
关于N>=3f+1
假设总共有N个节点,其中有F个拜占庭节点,拜占庭节点是可以不发送消息的,所以为了保证活性,主节点收到N-F个节点发送来的消息就要做出判断,考虑极端情况:N-F个消息中恰好有F个是拜占庭节点发来的,因为网络存在延迟等原因,诚实节点的消息可能会比拜占庭节点的消息更晚到达。此时N-F个消息中只有N-2F个是正确节点发送来的,所以为了保证消息的正确性,即需要诚实节点数量大于拜占庭节点F,则有N-2F>F,则至少需要保证N=3F+1。
具体流程
关于整个流程的具体流程讲解可以参考:简书,本文针对论文中的重点和难点进行提取。
重点提取
- pre-prepare阶段和prepare阶段确保所有正常节点对同一个视图中的请求排序达成一致,prepare和commit两个阶段用来确保在不同的视图之间的请求也是严格排序的。
证明1: 当节点收到了一个pre-prepare和对应的2f个prepare消息之后,进入准备完毕阶段,记作prepared(m, v, n, i).。假如有prepared(m,v,n,i)为真且prepared(m’,v,n,j)也为真,那么可以由接受prepared的条件可以看出,有f+1个好节点(包括他本身)发出了prepare消息接受m,另有f+1个好节点发出了prepare接受m’,这样好节点为2f+2
但是N=3f+1,好节点只有N-f=2f+1个,有矛盾。
证明2:**某个好节点i达到committed-local说明其至少接收了2f+1个节点的commit消息,所以至少有f+1个好节点的commit消息。好节点发送commit需要保证是已经进入prepared状态才行。这样就至少有f+1个好节点进入了prepared状态。如果发生视图转换的时候,新的主节点需要收到2f个来自其他不同节点的view-change消息(加上自己就是2f+1个消息)。网络中总有3f+1个节点,所以f+1个好节点肯定至少有一个会把已经prepared的消息发送到下一个视图中继续达成共识。
如果一个节点达到了prepared状态,就认为全网共识了是有问题的,因为你收到凭证不代表其他人也受到足够的确认也生成凭证。想象一下,如果就你生成凭证的情况下,你认为全网已经共识了,甚至返回用户结果。这时发生viewchange,所有的交易都要被重放,新的View从2f+1个回复中重新生成pre-prepare,但是如果2f+1个回复中不包含你的消息,那么你认为全网已经共识的交易就会凭空消失,而此时你甚至已经返回用户结果了,这是很有问题的。所以需要加多一个commit阶段,commit阶段是让你知道别人也拿到这样的凭证的(因为一个节点达到了commited-local证明有f+1个好节点已经prepared),这样即使发生viewchange,因为Quorum的性质,保证你这个已经prepared凭证的消息,一定会出现再重放名单中。
这也暗示了,Viewchange会发生请求丢失的情况,因为收集的2f+1个回复中只能保证那个commit阶段完成的prepare凭证消息能够重放。那些没完成commit阶段的prepare凭证消息可能会丢失,没拿到prepare凭证的消息绝对会被丢失。这时就是可用性的问题了,用户长时间没收到结果会重新发消息(因为消息丢失了,只能这样)。同时,因为丢失问题,我们意识到中间有些序号是没有相应的消息的,此时新主会填充为null消息。
优缺点总结
优势
- 首个实用的BFT容错算法,使得复杂度从指数级降到多项式级 O(n2);
- 响应性(Responsiveness):在网络状况OK,主节点不犯错,拜占庭节点数量不超过f个时, 在下一个视图一定是可以达成共识的;
不足
- 通信复杂度 O(n2) ,可扩展性低;
- 视图转换的复杂度 O(n3),要是连续视图转换复杂度 O(f* n3),视图转换复杂,很“重”;
- 视图转换期间只能接收viewchange、newview消息不能对外提供服务;
- Safety和Liveness耦合,都需要通过视图转换来保障;
- 去重机制没有提;
参考资料:
https://www.jianshu.com/p/0bef4fb1662b
https://blog.csdn.net/jason_cuijiahui/article/details/79613633
https://blog.csdn.net/u011537073/article/details/53519074
源码:https://github.com/Liukemeng/Fabric0.6-PBFT-Learning
原文:https://pmg.csail.mit.edu/papers/osdi99.pdf