MapReduce 低效减速器

发布于 2024-10-28 02:06:00 字数 55 浏览 0 评论 0原文

除了map函数输出的所有键都相同之外,什么会导致MapReduce作业中只有一个reducer?

What would cause only a single reducer in a MapReduce job apart from all the keys output by the map function being the same?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

我偏爱纯白色 2024-11-04 02:06:00

可能的原因:

  1. 您的集群仍然具有只有 1 个减速器的默认设置(= 默认值)。
  2. 您的代码明确将该值设置为 1 个减速器。
  3. 您正在本地模式下运行(即根本没有集群)。

引用自 mapred -默认.xml

<property>
  <name>mapred.reduce.tasks</name>
  <value>1</value>
  <description>The default number of reduce tasks per job. Typically set to 99%
  of the cluster's reduce capacity, so that if a node fails the reduces can 
  still be executed in a single wave.
  Ignored when mapred.job.tracker is "local".
  </description>
</property>

Possible causes:

  1. Your cluster still has the default setting of having only 1 reducer (= default value).
  2. Your code explicitly sets the value to be 1 reducer.
  3. You are running in local mode (i.e. no cluster at all).

Quote from mapred-default.xml

<property>
  <name>mapred.reduce.tasks</name>
  <value>1</value>
  <description>The default number of reduce tasks per job. Typically set to 99%
  of the cluster's reduce capacity, so that if a node fails the reduces can 
  still be executed in a single wave.
  Ignored when mapred.job.tracker is "local".
  </description>
</property>
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文