当前位置：文江博客话题详情

如何让 Hadoop 使用我系统上的所有核心？

发布于 2024-12-09 08:31:07 字数 149 浏览 0 评论 0原文

我有一个32核的系统。当我使用 Hadoop 运行 MapReduce 作业时，我从未看到 java 进程使用超过 150% CPU（根据 top），并且通常保持在 100% 左右。它应该接近 3200%。

我需要更改哪些属性（以及在哪个文件中）才能启用更多工作人员？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夏尔 2024-12-16 08:31:07

可能有两个问题，我在下面概述。我还想指出，这是一个非常常见的问题，您应该查看之前提出的 Hadoop 问题。

您的 mapred.tasktracker.map.tasks.maximum 可能在 conf/mapred-site.xml 中设置得较低。如果当您检查 JobTracker 时，您看到几个待处理的任务，但只有几个正在运行的任务，这将是问题所在。每个任务都是一个线程，因此假设该节点上最多需要 32 个插槽。

否则，您的数据可能没有被分割成足够的块。您正在运行少量数据吗？您的 MapReduce 作业可能仅在几个输入拆分上运行，因此不需要更多映射器。尝试在数百 MB 的数据上运行您的作业，看看您是否仍然遇到相同的问题。
Hadoop 自动分割您的文件。文件分成的块数是文件的总大小除以块大小。默认情况下，一个映射任务将分配给每个块（而不是每个文件）。

在您的conf/hdfs-site.xml配置文件中，有一个dfs.block.size参数。大多数人将此设置为 64 或 128mb。但是，如果您尝试做一些小事情，您可以将其设置为更多地分解工作。

您还可以手动将文件拆分为 32 个块。

回复收藏 0 原文

墨小墨 2024-12-16 08:31:07

我认为你需要将“mapreduce.framework.name”设置为“yarn”，因为默认值是“local”。

将以下内容放入您的mapred-site.xml中

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

I think you need to set "mapreduce.framework.name" to "yarn",because the default value is "local".

put the following into your mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

回复收藏 0 原文

~没有更多了~

关于作者

つ可否回来

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

如何让 Hadoop 使用我系统上的所有核心？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

如何让 Hadoop 使用我系统上的所有核心？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。