当前位置：文江博客话题详情

Java parallel-processing distribution workload

JAVA 中的工作负载分配/并行执行

发布于 2024-07-25 04:38:28 字数 639 浏览 7 评论 0原文

我遇到的情况是，我需要将工作分配给在不同 JVM（可能是不同机器）中运行的多个 JAVA 进程。

假设我有一个包含记录 1 到 1000 的表。我正在寻找要收集和分发的工作，以 10 为一组。假设将记录 1-10 分配给了workerOne。然后将11-20记录给workerThree。等等等等。不用说，workerOne 永远不会做workerTwo 的工作，除非workerTwo 无法完成。

这个例子纯粹基于数据库，但可以扩展到任何系统，我相信是文件处理、电子邮件处理等等。

我有一种小小的感觉，立即的反应是采用主/工人方法。然而这里我们讨论的是不同的 JVM。即使一个 JVM 宕机，另一个 JVM 也应该继续执行其工作。

现在，百万美元的问题是：是否有任何好的框架（生产就绪）可以让我方便地做到这一点。即使有特定需求的具体实现，例如数据库记录、文件处理、电子邮件处理等。

我见过 Java 并行执行框架，但不确定它是否可以用于不同的 JVM，如果一个 JVM 宕机，另一个会继续运行。我相信 Workers 可以在多个 JVM 上，但是 Master 呢？

更多信息 1：由于 JDK 1.6 要求，Hadoop 将成为一个问题。那就有点太多了。

谢谢，富兰克林

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（7）

独夜无伴 2024-08-01 04:38:29

我会考虑使用 Jgroups。您可以对 jvm 进行集群，并且可以选择其中一个节点作为主节点，然后可以通过通过网络发送消息将工作分配给其他节点。或者，您已经可以对工作项进行分区，然后在主节点中管理分区的分布，例如partion-1进入JVM-4，partion-2进入JVM-3，partion-3进入JVM-2等等。如果 JVM-4 发生故障，主节点将意识到这一点，然后主节点将通知其他节点之一也开始拾取分区 1。
另一种更容易使用的替代方案是 redis pub sub 支持。 http://redis.io/topics/pubsub 。但随后你将不得不维护我不喜欢的 redis 服务器。

回复收藏 0 原文

不再让梦枯萎 2024-08-01 04:38:28

可能需要研究 MapReduce 和 Hadoop

回复收藏 0 原文

迷爱 2024-08-01 04:38:28

您还可以使用消息队列。有一个流程可以生成工作列表并将其打包成漂亮的小块。然后它将这些块放入队列中。每个工作人员都在队列中等待有东西出现。当它发生时，工作人员从队列中取出一个块并对其进行处理。如果一个进程出现故障，其他进程就会弥补这一不足。很简单，人们长期以来一直这样做，所以网上有很多关于它的信息。

回复收藏 0 原文

简单 2024-08-01 04:38:28

查看 Hadoop

回复收藏 0 原文

世态炎凉 2024-08-01 04:38:28

我相信 Terracotta 可以做到这一点。如果你正在处理网页，JBoss可以是集群的。

如果您想自己执行此操作，您将需要一个工作经理来跟踪待完成的工作、正在进行的工作以及从未完成且需要重新安排的工作。然后，工人们要求做某事，去做，然后将结果发回，要求更多。

您可能需要详细说明您想要做什么类型的工作。

回复收藏 0 原文

未央 2024-08-01 04:38:28

您所描述的问题绝对最好使用主/工作模式来解决。

您应该看看 JavaSpaces（Jini 框架的一部分），它非常适合这种事情。基本上，您只想将要执行的每个任务封装在 Command 对象内，并根据需要进行子类化。将它们转储到 JavaSpace 中，让您的工作人员一次抓取并处理一个，然后在完成后重新组装。

当然，您的性能提升完全取决于处理每组记录所需的时间，但如果分布在多台机器上，JavaSpaces 不会造成任何问题。

回复收藏 0 原文

寂寞花火° 2024-08-01 04:38:28

如果您处理单个数据库中的记录，请考虑使用存储过程在数据库本身内执行该工作。在不同机器上处理记录的收益可能会被数据库和计算节点之间检索和传输工作的成本所抵消。

对于文件处理来说，情况可能类似。处理（共享）文件系统中的文件可能会给操作系统带来巨大的 I/O 压力。

在多台机器上维护多个 JVM 的成本也可能过高。

对于这个问题：我曾经使用JADE（Java代理开发环境）进行一些分布式模拟。它的多机支持和消息传递性质可能会对您有所帮助。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

卖梦商人

文章 0 评论 0

聊慰

文章 0 评论 0

再可℃爱ぅ一点好了

文章 0 评论 0

内心荒芜

文章 0 评论 0

mb_vBKS9whW

文章 0 评论 0

俯瞰星空

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文