使用大文件作为消息负载进行发布/订阅

发布于 09-17 11:45 字数 619 浏览 14 评论 0原文

我们现有的系统可以持续处理大量文件。粗略地说，每天大约有 300 万个文件，大小从几千字节到超过 50 MB。这些文件从接收到完成使用会经历几个不同的处理阶段，具体取决于它们所采用的路径。由于这些文件的内容和格式，它们无法分解为更小的块。

目前，这些文件移动的工作流程是严格的，并且由具有固定输入和输出的代码决定（在许多情况下，一个订阅者成为一组新文件的发布者）。然而，缺乏灵活性开始给我们带来问题，因此我正在寻找某种发布/订阅解决方案来处理新的需求。

大多数传统的发布/订阅解决方案都在实际有效负载中包含数据，但潜在的大文件大小超出了许多消息传递平台的限制。此外，我们还拥有多个平台：文件根据其路径在 Linux 和 Windows 层中进行。

有没有人有任何考虑到以下目标的设计和/或实施建议？
1. pub 和 sub 的多平台（Linux 和 Windows）
2. 持久存储/存储转发支持
3. 可以处理大型事件负载，并在所有订阅者都得到服务后进行适当的清理
4.路由/工作流通过配置完成
5.订阅者可以根据不断变化的条件订阅一组经过过滤的已发布事件（例如，只给我特定类型的文件）

我已经深入研究了许多服务总线和 MQ 实现，但还没有完全了解能够确定足够的设计方法来正确评估哪些工具最有意义。感谢您的任何意见。

原文