当前位置：文江博客话题详情

分布式系统中用于共识的更快的 Paxos 相关算法有哪些？

发布于 2024-08-16 07:53:07 字数 173 浏览 13 评论 0原文

我读过 Lamport 的论文帕克索斯。我还听说，由于性能原因，它在实践中使用不多。分布式系统中常用的共识算法有哪些？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

千鲤 2024-08-23 07:53:08

使用 Multi-Paxos，当领导者正在驰骋时，当它听到大多数节点已将值写入磁盘时，它可以响应客户端写入。这是您可以保持 Paxos 所做的一致性保证的最好和最有效的方法。

通常，人们使用类似 paxos 的东西，例如 Zookeeper 作为外部服务（专用集群）来保持关键信息一致（谁锁定了什么、谁是领导者、谁在集群中、集群的配置是什么），然后运行不太严格的算法，一致性保证较少，依赖于应用程序细节（例如矢量时钟和合并的同级）。简短的电子书分布式系统的乐趣和利润作为一本好书替代方案概述。

请注意，许多数据库通过使用有风险的默认值来竞争速度，这会带来一致性风险，并且可能会在网络分区下丢失数据。 Jepson 上的 Aphry 博客系列显示了众所周知的 opensouce 系统是否存在松散数据。 CAP 定理无法被欺骗；如果您为了安全而配置系统，那么它们最终会执行与 paxos 相同的消息传递和相同的磁盘写入操作。所以实际上你不能说 Paxos 很慢，你必须说“系统的一部分需要在网络分区下保持一致性，每个操作需要最少数量的消息和磁盘刷新，这很慢”。

回复收藏 0 原文

萌逼全场 2024-08-23 07:53:08

有两种通用的区块链共识系统：

那些在给定一组定义的情况下产生明确的 100% 最终结果的系统
验证者
那些不提供 100% 最终确定性的验证者
依赖高概率的最终结果。

第一代区块链共识算法（工作量证明、股权证明和比特股的委托股权证明）仅提供随着时间的推移而增长的高确定性概率。理论上，有人可以支付足够的钱来挖掘替代的“更长”的比特币区块链，该区块链可以一直追溯到创世。

最近的共识算法，无论是 HashGraph、Casper、Tendermint 还是 DPOS BFT，都采用了 Paxos 和相关共识算法长期确立的原理。在这些模型下，只要超过 2/3 的参与者是诚实的，就可以在所有网络条件下达到明确的最终结果。

对于所有希望支持区块链间通信的区块链来说，客观且明确的 100% 最终确定性是一个关键属性。如果没有 100% 的最终确定性，一条链上的逆转可能会对所有互连链产生不可调和的连锁反应。

这些较新协议的抽象协议涉及：

提议块
所有参与者确认块（预承诺）
当 ⅔+ 已向他们发送预承诺时，所有参与者都会确认
（承诺）
一旦节点收到 ⅔+ 承诺，区块就成为最终的
除非 ⅓+ 承诺，否则就保证最终性达成一致
协议中的

技术差异对用户体验产生了实际影响。这包括最终确定之前的延迟、最终确定程度、带宽以及证明生成/验证开销等。

此处

回复收藏 0 原文

三生殊途 2024-08-23 07:53:08

Raft 是 Paxos 的更易于理解、更快的替代方案。使用 Raft 的最流行的分布式系统之一是 Etcd。 Etcd 是 Kubernetes 中使用的分布式存储。

在容错方面相当于Paxos。

回复收藏 0 原文

梅倚清风 2024-08-23 07:53:07

不确定这是否有帮助（因为这不是来自实际生产信息），但在我们的“分布式系统”课程中，我们与 Paxos 一起研究了 Chandra-Toueg 和 Mostefaoui -Raynal算法（我们的教授特别喜欢后者）。

回复收藏 0 原文

奢望 2024-08-23 07:53:07

查看 Raft 算法以获得共识算法，该算法经过优化，易于理解且实现清晰。哦……速度也蛮快的。

https://ramcloud.stanford.edu/wiki/display/logcabin/LogCabin

https://ramcloud.stanford.edu/wiki/download/attachments/11370504 /筏.pdf

回复收藏 0 原文

凉世弥音 2024-08-23 07:53:07

如果性能是一个问题，请考虑您是否需要 Paxos 为您提供的所有强一致性保证。参见例如 http://queue.acm.org/detail.cfm?id=1466448< /a> 和 http://incubator.apache.org/cassandra/。搜索 Paxos 优化会得到一些结果，但我怀疑放宽一些要求比调整协议更能给你带来好处。

回复收藏 0 原文

庆幸我还是我 2024-08-23 07:53:07

我运行的 Paxos 系统（支持非常非常大的网站）介于 Basic-Paxos Multi-paxos 之间。 ~~我计划将其迁移到完整的 Multi-Paxos 实现。~~

Paxos 作为高吞吐量数据存储系统并不是那么出色，但它擅长通过提供领导者选举来支持这些系统。例如，假设您有一个复制数据存储，出于性能原因您需要单个主数据库。您的数据存储节点将使用 Paxos 系统来选择主节点。

与 Google Chubby 一样，我的系统作为服务运行，也可以将数据存储为配置容器。（我宽松地使用配置；我听说 Google 使用 Chubby 作为 DNS。）此数据不会像用户输入那样频繁更改，因此不需要高吞吐量写入 SLA。另一方面，读取速度非常快，因为它是完全复制的，并且您可以从任何节点读取。

更新

自从写这篇文章以来，我升级了我的 Paxos 系统。我现在使用链共识协议作为主要共识系统。链系统仍然利用 Basic-Paxos 进行重新配置，包括在链成员资格发生变化时通知链节点。

回复收藏 0 原文

你穿错了嫁妆 2024-08-23 07:53:07

就共识协议的性能而言，Paxos 是最优，至少在网络延迟数量（这通常是主导因素）方面是如此。如果在客户端请求之间没有与至少 (f-1) 个其他节点进行单次往返通信，则显然不可能在容忍最多 f 个故障的同时可靠地达成共识以及相应的确认，Paxos 达到了这个下界。无论实现如何，这都对基于共识的协议的每个请求的延迟给出了严格限制。特别是，Raft、Zab、Viewstamped Replication 和共识协议的所有其他变体都具有相同的性能约束。

标准 Paxos（还有 Raft、Zab 等）可以改进的一件事是，有一个杰出的领导者最终完成的工作超出了其应得的工作份额，因此可能最终成为一个瓶颈。有一种名为 Egalarian Paxos 的协议，它将负载分散到多个领导者之间，尽管在我看来，它非常复杂，但仅适用于某些领域，并且仍然必须遵守每个请求中往返次数的下限。有关更多详细信息，请参阅 Moraru 等人的论文“平等主义议会中存在更多共识”。

当你听说 Paxos 由于性能不佳而很少使用时，通常意味着共识本身由于性能不佳而很少使用，这是一个公平的批评：它有可能实现更高的目标如果您可以尽可能避免节点之间基于共识的协调，则可以提高性能，因为这可以实现水平可扩展性。

讽刺的是，通过声称使用正确的共识协议但实际上做了一些在某些情况下会失败的事情也有可能获得更好的性能。 Aphyr 的博客中充斥着这些失败的例子，这些失败并不像您想象的那么罕见，数据库实现有要么通过“优化”的方式将错误引入良好的类似共识的协议，要么开发出自定义的类似共识的协议，但在某些微妙的方式下无法完全正确。这东西很难。

Paxos is optimal in terms of performance of consensus protocols, at least in terms of the number of network delays (which is often the dominating factor). It's clearly not possible to reliably achieve consensus while tolerating up to f failures without a single round-trip communication to at least (f-1) other nodes in between a client request and the corresponding confirmation, and Paxos achieves this lower bound. This gives a hard bound on the latency of each request to a consensus-based protocol regardless of implementation. In particular, Raft, Zab, Viewstamped Replication and all other variants on consensus protocols all have the same performance constraint.

One thing that can be improved from standard Paxos (also Raft, Zab, ...) is that there is a distinguished leader which ends up doing more than its fair share of the work and may therefore end up being a bit of a bottleneck. There is a protocol known as Egalitarian Paxos which spreads the load out across multiple leaders, although it's mindbendingly complicated IMO, is only applicable to certain domains, and still must obey the lower bound on the number of round-trips within each request. See the paper "There Is More Consensus in Egalitarian Parliaments" by Moraru et al for more details.

When you hear that Paxos is rarely used due to its poor performance, it is frequently meant that consensus itself is rarely used due to poor performance, and this is a fair criticism: it is possible to achieve much higher performance if you can avoid the need for consensus-based coordination between nodes as much as possible, because this allows for horizontal scalability.

Snarkily, it's also possible to achieve better performance by claiming to be using a proper consensus protocol but actually doing something that fails in some cases. Aphyr's blog is littered with examples of these failures not being as rare as you might like, where database implementations have either introduced bugs into good consensus-like protocols by way of "optimisation", or else developed custom consensus-like protocols that fail to be fully correct in some subtle fashion. This stuff is hard.

回复收藏 0 原文