当前位置：文江博客话题详情

使用 R 时，我应该更喜欢 hadoop 还是 condor？

发布于 2024-09-30 17:48:21 字数 296 浏览 5 评论 0原文

我正在寻找为我的大学计算机网格上的多台计算机发送作品的方法。

目前它运行的是 Condor，还提供 Hadoop。

因此，我的问题是，我应该尝试将 R 与 Hadoop 或 Conder 接口用于我的项目吗？

为了进行讨论，我们假设我们正在讨论令人尴尬的并行任务。

ps：我已经看到了 CRAN 任务视图中描述的资源。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

笑，眼淚并存 2024-10-07 17:48:21

你可以两者都做。

您可以使用 HDFS 作为数据集，使用 Condor 进行作业调度。使用 Condor 将执行器放置在机器上，并使用 HDFS + Hadoop Map-Reduce 功能来处理数据（假设您的问题是可映射的 map-reduce）。然后，您将使用最适合该工作的工具：Condor 是一个作业调度程序，因此它比 Hadoop 工作得更好。 Hadoop 的 HDFS 和 MR 框架是 Condor 所没有的（但对于在 Condor 上运行的作业使用确实很有帮助）。

我个人会考虑使用 HDFS 在作为 Condor 作业离散运行的作业之间共享数据。特别是在大学环境中，共享计算资源并非 100% 可靠，并且可以随意来来去去，Condor 在此类设置中的弹性将使完成工作变得更加容易。

回复收藏 0 原文

~没有更多了~