哪个集群节点应该处于活动状态？

发布于 2024-09-04 02:05:13 字数 177 浏览 11 评论 0原文

有一些集群和一些unix网络守护进程。该守护进程在每个集群节点上启动，但只有一个节点可以处于活动状态。

当活动守护进程中断时（无论节点的程序中断），其他节点应变为活动状态。

我能想到几种可能的算法，但我认为已经对此进行了一些研究，并且有一些现成的算法？我说得对吗？你能指出我的答案吗？

谢谢。

需要登录才能够评论，你可以免费注册一个本站的账号。

痴者 2024-09-11 02:05:13

Jgroups 是一个 Java 网络堆栈，其中包括 DistributedLockManager 类型的支持和集群投票功能。这些允许任意数量的 UNIX 守护进程就谁应该处于活动状态达成一致。例如，所有节点都可能尝试获取锁，并且只有一个节点会成功，直到应用程序或节点失败。

Jgroups 还有特定通信通道协调器的概念。一次只有一个节点可以成为协调员，当一个节点发生故障时，另一个节点将成为协调员。测试您是否是协调员很简单，在这种情况下您将处于活动状态。

如果您要自己实现此功能，则需要记住很多内容：

每个节点都需要具有一致的集群视图。
所有节点都需要通知所有其余节点它们在线——可能通过多播。
离线的节点（由于 ap 或节点故障）需要从所有其他节点的“视图”中删除。
然后，您可以让 IP 最低的节点或其他节点成为活动节点。
如果这不合适，那么您将需要进行某种投票交换，以便节点可以就谁是活跃的达成一致。类似于： http://en.wikipedia.org/wiki/Two-phase_commit_protocol