文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

3.3 Hadoop 优化

发布于 2024-09-23 22:13:01 字数 1294 浏览 0 评论 0 收藏 0

表格 20 Hadoop 优化列表

优化内容	最佳实践
mapper 的数量	运行 mapper 需要多长时间？
reducer 的数量	为了达到最高性能，reducer 的数目应该比 reducer 槽（由内存和 tasktracker 槽决定）的数目稍微少一点，这将 reducer 使 reducer 能够在同一波中完成任务。
combiner	作业能否充分利用 combiner 来减少通过 shuffle 传输的数据
中间值的产生	对 map 输出进行压缩能使作业执行更快
自定义序列	如果正在使用自定义的 writable 对象或自定义的 comparator，则必须确保已实现 RawComparator
shuffle	Shuffle 可以对一些内存管理的参数进行调整，弥补性能不足。