当前位置：文江博客话题详情

MapReduce memory apache-pig

Apache PIG 问题

发布于 2024-11-18 05:15:21 字数 565 浏览 5 评论 0原文

我对运行 Pig 脚本/ Map-Reduce 作业有几个问题。

我知道pig在真正开始执行map/reduce作业之前会创建逻辑计划、物理计划以及执行计划；我可以使用命令 explain查看逻辑/物理计划；但是我如何查看执行计划（我想它列出了计划的不同映射/归约任务）？在 Pig 执行过程中，我看到创建了许多作业（map/reduce 对）。想要了解每个作业解决什么问题。
是否有任何明确的指南可以用来理解所创建的计划，因为口水是很难理解的。
我可以通过更改输入文件块的数量来更改映射作业的数量。我也可以控制减少作业的数量吗？如何设置减速器的数量？
mapper/reducer 节点中的默认堆内存大小是多少？哪些工作参数反映了这些？我可以通过 -Xmx 1024m 选项更改堆内存吗？当我以这种方式设置堆内存时，我的作业常常会失败 - 可能对可以提供的值有一些限制？

非常感谢！

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

俯瞰星空 2024-11-25 05:15:21

解释生成了不同类型的计划。提供一个目录路径而不是一个文件来从“explain”获取所有 3 个计划。
不知道。
set default_parallel 10 会将reduce 作业数量设置为10。
它必须在您的 hadoop 设置中。

回复收藏 0 原文

反话 2024-11-25 05:15:21

“Explain(pig command )” ALIAS-NAME 解释物理计划（就 Map reduce 作业而言）
别名将在 MR 作业中分组在一起。在计划阶段本身，人们可以看到，所有别名都已分组到给定的 MR 中。
为了控制减速器的数量，可以在编写 join 、 groupby 时使用“USING PARALLELdesired_no”，或者在开始时使用“setdefault_paralleldesiredno”猪脚本。
这取决于一只奔跑的猪在哪里。
如果是 MRv1 ：设置 mapred.java.opts -Xmx
在mrv2中：设置mapred.map.size，设置mapred.map.java.opts -Xmx

回复收藏 0 原文

~没有更多了~

关于作者

离笑几人歌

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

知足的幸福

文章 0 评论 0

我一向站在原地

文章 0 评论 0

慕烟庭风

文章 0 评论 0

秉忠贞之诚守退让之实

文章 0 评论 0

小兔几

文章 0 评论 0

mb_3y7WUgWY

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文