Hadoop项目的存储库组织

发布于 2024-09-03 10:36:51 字数 146 浏览 5 评论 0原文

我正在开始一个新的 Hadoop 项目，该项目将有多个 hadoop 作业（因此有多个 jar 文件）。使用 Mercurial 进行源代码控制，我想知道组织存储库结构的最佳方式是什么？每个作业是否应该位于单独的存储库中，或者将它们保留在同一个存储库中但分解为文件夹会更有效吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

忆离笙 2024-09-10 10:36:51

如果您正在对 Hadoop 作业进行管道化（一个作业的输出是另一个作业的输入），我发现最好将其中大部分保留在同一个存储库中，因为我倾向于生成许多可以在各种应用中使用的常用方法。先生职位。

就我个人而言，我将流作业与更传统的作业保存在单独的存储库中，因为通常没有依赖性。

您打算使用 DistributedCache 或流作业吗？您可能需要一个单独的目录来存放您分发的文件。每个 Hadoop 作业真的需要一个 JAR 吗？我发现我没有。

如果您提供有关您计划使用 Hadoop 做什么的更多详细信息，我可以看到我还能提出什么建议。

回复收藏 0 原文

~没有更多了~

关于作者

夏雨凉

暂无简介

0 文章

0 评论

24 人气

关注发私信

小瓶盖

文章 0 评论 0

关注

wxsp_Ukbq8xGR

文章 0 评论 0

关注

1638627670

文章 0 评论 0

关注

仅一夜美梦

文章 0 评论 0

关注

夜访吸血鬼

文章 0 评论 0

关注

近卫軍团

文章 0 评论 0

友情链接

文江博客

Hadoop项目的存储库组织

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者