当前位置：文江博客话题详情

在 hadoop 中并行运行作业

发布于 2024-12-05 15:05:10 字数 150 浏览 0 评论 0原文

我是 hadoop 新手。

我已经设置了一个 2 节点集群。

如何在 hadoop 中并行运行 2 个作业。

当我提交作业时，它们按照 FIFO 顺序一项一项地运行。我必须并行运行这些作业。如何实现这一目标。

谢谢 MRK

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

橙味迷妹 2024-12-12 15:05:10

Hadoop 可以配置多种调度器，默认是 FIFO 调度器。

FIFO 调度的行为如下。

场景一：如果集群有10个Map Task容量，job1需要15个Map Task，那么运行job1会占用整个集群。当 job1 取得进展并且有可用的空闲插槽但 job1 未使用时，job2 将在集群上运行。

场景二：如果集群有10个Map Task容量，job1需要6个Map Task，那么job1占用6个slot，job2占用4个slot。 job1 和 job2 并行运行。

要从一开始就并行运行作业，您可以配置公平调度程序或根据您的要求容量调度程序。必须设置mapreduce.jobtracker.taskscheduler和特定的调度程序参数才能使其在mapred-site.xml。

编辑：根据 MRK 的评论更新了答案。

回复收藏 0 原文

童话里做英雄 2024-12-12 15:05:10

您有“映射任务容量”和“减少任务容量”。只要有空，他们就会按照先进先出的顺序挑选工作。您提交的作业包含映射器和可选的减速器。如果您的作业映射器（和/或减速器）数量小于集群的容量，它将占用下一个作业映射器（和/或减速器）。

如果您不喜欢先进先出，您始终可以优先处理您提交的作业。

编辑：

抱歉，有轻微的错误信息，Praveen 的答案是正确的。
除了他的回答之外，您还可以检查HOD调度程序。

回复收藏 0 原文

悍妇囚夫 2024-12-12 15:05:10

使用默认调度程序，每个用户一次只能执行一项作业。您可以从不同的用户 ID 启动不同的作业。当然，它们将并行运行，正如其他人提到的，您需要有足够的插槽容量。

回复收藏 0 原文

~没有更多了~

关于作者

百善笑为先

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

在 hadoop 中并行运行作业

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

在 hadoop 中并行运行作业

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。