分离 Hadoop Map 和 Reduce 任务

发布于 2024-11-01 09:08:46 字数 137 浏览 4 评论 0原文

在 3 节点 hadoop 集群中。我希望主节点为 1 个节点。 Map任务发生在1个节点,Reduce任务发生在1个节点。 Map和Reduce任务应该分开。是否可以?据我所知,两者一起运行。如果你能透露一些信息那就太好了。谢谢 !

-塞图

In a 3 node hadoop cluster. I would like the master to be 1 node. Map task taking place in one node and reduce tasks in 1 node. Map and reduce tasks should be separated. Is it possible? As far as i noticed both run together. It will be great if you can shed some light. Thank you !

-Sethu

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

彡翼 2024-11-08 09:08:46

这并不是最佳选择,因为地图输出必须始终复制到另一台服务器。
但是您可以简单地修改服务器上的mapred-site.xml。

<property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>4</value>
    <description>The maximum number of map tasks that will be run simultaneously by a task tracker.</description>
</property>

<property>
    <name>mapred.tasktracker.reduce.tasks.maximum</name>
    <value>4</value>
    <description>The maximum number of reduce tasks that will be run simultaneously by a task tracker.</description>
</property>

在不应该运行reducer的服务器上,您可以将reduce.task.maximum设置为零。对于其他服务器反之亦然。

This is everything else than optimal because the map output must ALWAYS be copied to another server.
But you can simply modify your mapred-site.xml on the servers.

<property>
    <name>mapred.tasktracker.map.tasks.maximum</name>
    <value>4</value>
    <description>The maximum number of map tasks that will be run simultaneously by a task tracker.</description>
</property>

<property>
    <name>mapred.tasktracker.reduce.tasks.maximum</name>
    <value>4</value>
    <description>The maximum number of reduce tasks that will be run simultaneously by a task tracker.</description>
</property>

On the server where no reducers should run you put into the reduce.task.maximum a zero. And vice versa for the other servers.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文