当前位置：文江博客话题详情

Hadoop 工作负载

发布于 2024-11-02 18:33:11 字数 111 浏览 2 评论 0原文

我目前正在使用hadoop 中的wordcount 应用程序作为基准。我发现 CPU 使用率几乎稳定在 80-90% 左右。我希望 CPU 使用率有波动。有没有任何hadoop应用程序可以给我这种能力？多谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

生生不灭 2024-11-09 18:33:12

我认为没有办法限制或指定 hadoop 使用的范围。 Hadoop 将使用可用的 CPU。当我从事很多工作时，我的成功率始终保持在 90% 以上的范围内。

控制 CPU 使用率的一种方法是更改每个任务跟踪器可以同时运行的映射器/缩减器的最大数量。这是通过
$HADOOP_HOME/conf/core-site.xml 中的 mapred.tasktracker.{map|reduce}.tasks.maximum 设置。

当映射器/减速器的数量有限时，它将在该任务跟踪器上使用更少的 CPU。

另一种方法是在设置作业时设置 mapred.tasktracker.{map|reduce}.tasks 的配置值。这将迫使该作业使用那么多映射器/减速器。该数字将分配给可用的任务跟踪器，因此，如果您有 4 个节点并希望每个节点有 1 个映射器，您可以将 mapred.tasktracker.map.tasks 设置为 4。也有可能，如果一个节点可以运行 4 个映射器，那么它将运行所有 4 个映射器，我不知道 hadoop 究竟如何分割任务，但每个作业强制一个数字是一种选择。

我希望这能帮助您到达目的地。我还是不太明白你在找什么。 :)