带有两个 jar 的 Hadoop Mapreduce（仅在 namenode 上需要其中一个 jar）

发布于 2024-11-04 18:32:52 字数 505 浏览 3 评论 0原文

mapred 任务是一个由 Java 实现的非常简单的“字数统计”（请参阅 http://wiki.apache。 org/hadoop/WordCount ）。

在最后一行之后，“job.waitForCompletion(true);” 我添加了一些由 Jython 实现的代码。

这意味着 Jythoon 的库仅在 namenode 上需要。但是，我将 Jython 的所有库添加到一个 jar 中，然后执行后，

hadoop jar wordcount.jar in out

wordcount就完成了，没有任何问题。

我想解决的问题是我必须为 Jython 提供大量库，而从属节点（映射器和化简器）不需要这些库。 jar 几乎有 15M（Jython 超过 14M）。

我可以将它们分开并得到相同的结果吗？

原文

The mapred task is a very simple 'wordcount' implemented by Java (plz, see http://wiki.apache.org/hadoop/WordCount ).

after the last line, "job.waitForCompletion(true);"
I add some code implemented by Jython.

It means the libraries for Jythoon is only needed on namenode.
However, I added all libraries for Jython to a single jar, and then
executed it

hadoop jar wordcount.jar in out

The wordcount is done without any problem.

The problem I want to solve is I have to heavy libraries for Jython that is not needed for the slave nodes(mappers and reducers). the jar is almost 15M (upper than 14M is for Jython).

Can I split them, and get the same results?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

百变从容 2024-11-11 18:32:52

没有人知道这个问题。

我已经解决了这个问题，如下：即使它不是最好的。

简单地说，将 jython.jar 复制到 /usr/local/hadoop （或安装 hadoop 的路径），这是 hadoop 的默认类路径，并制作一个没有 jython.jar 的 jar

如果您需要非常大的库来映射减少任务，那么

将jython.jar上传到hdfs
hadoop fs -put jython.jar Lib/jython.jar
将以下行添加到您的主代码
DistributedCache.addFileToClassPath(new URI("Lib/jython.jar"));

回复收藏 0 原文

~没有更多了~

关于作者

別甾虛僞

暂无简介

0 文章

0 评论

24 人气

关注发私信

小瓶盖

文章 0 评论 0

关注

wxsp_Ukbq8xGR

文章 0 评论 0

关注

1638627670

文章 0 评论 0

关注

仅一夜美梦

文章 0 评论 0

关注

夜访吸血鬼

文章 0 评论 0

关注

近卫軍团

文章 0 评论 0

友情链接

文江博客

带有两个 jar 的 Hadoop Mapreduce（仅在 namenode 上需要其中一个 jar）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者