绑定到群集 MSMQ 实例的 MSMQ 消息卡在传出队列中

发布于 2024-09-26 12:33:58 字数 688 浏览 6 评论 0原文

我们为一组 NServiceBus 服务聚集了 MSMQ，一切都运行良好，直到出现问题为止。一台服务器上的传出队列开始填满，很快整个系统就会挂起。

更多详细信息：

我们在服务器 N1 和 N2 之间有一个集群 MSMQ。其他集群资源只是作为本地直接在集群队列上操作的服务，即NServiceBus分配器。

所有工作进程都位于单独的服务器（Services3 和 Services4）上。

对于那些不熟悉 NServiceBus 的人来说，工作进入由分发器管理的集群工作队列中。 Service3 和 Services4 上的工作应用程序将“我已准备好工作”消息发送到由同一分发器管理的集群控制队列，分发器通过将工作单元发送到工作进程的输入队列进行响应。

在某些时候，这个进程可能会完全挂起。以下是系统挂起时群集 MSMQ 实例上的传出队列的图片：

挂起状态下的群集 MSMQ 传出队列

如果我将集群故障转移到另一个节点，就好像整个系统都受到了打击。以下是故障转移后不久的同一群集 MSMQ 实例的图片：

故障转移后的群集 MSMQ 传出队列

任何人都可以解释此行为，以及我可以做些什么来避免它，以保持系统平稳运行？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

╰つ倒转 2024-10-03 12:33:58

一年多过去了，我们的问题似乎已经解决了。关键要点似乎是：

确保您拥有可靠的 DNS 系统，以便当 MSMQ 需要解析主机时，它可以。
仅在 Windows 故障转移群集上创建一个 MSMQ 群集实例。

当我们设置Windows故障转移集群时，我们假设在非活动节点上“浪费”资源是不好的，因此，当时有两个准相关的NServiceBus集群，我们为Project1创建了一个集群MSMQ实例，以及 Project2 的另一个群集 MSMQ 实例。我们认为，大多数时候，我们会在单独的节点上运行它们，并且在维护时段期间它们会共同位于同一节点上。毕竟，这是我们为 SQL Server 2008 的主实例和开发实例所采用的设置，而且一直运行良好。

在某些时候，我开始对这种方法产生怀疑，特别是因为对每个 MSMQ 实例进行一次或两次故障似乎总是能让消息再次移动。

我向Udi Dahan（NServiceBus的作者）询问了这个集群托管策略，他一脸疑惑地问我“你为什么要做那样的事？”实际上，分发器非常轻量，因此实际上没有太多理由将它们均匀地分布在可用节点之间。

之后，我们决定利用我们所学到的一切仅使用一个 MSMQ 实例重新创建一个新的故障转移群集。从那以后我们就没有看到这个问题了。当然，确保这个问题得到解决将被证明是消极的，因此是不可能的。至少 6 个月以来，这都不是问题，但谁知道呢，我想明天可能就会失败！我们希望不会。