MapReduce 洗牌/排序方法
有点奇怪的问题,但是有人知道 MapReduce 在 shuffle/sort 的排序部分中使用哪种排序吗?我认为合并或插入(与整个 MapReduce 范例保持一致),但我不确定。
Somewhat of an odd question, but does anyone know what kind of sort MapReduce uses in the sort portion of shuffle/sort? I would think merge or insertion (in keeping with the whole MapReduce paradigm), but I'm not sure.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这是快速排序,然后将排序的中间输出合并在一起。
快速排序检查递归深度,当深度太深时放弃。如果是这种情况,则使用堆排序。
看一下 Quicksort 类:
您可以通过 hadoop-default.xml。
It's Quicksort, afterwards the sorted intermediate outputs get merged together.
Quicksort checks the recursion depth and gives up when it is too deep. If this is the case, Heapsort is used.
Have a look at the Quicksort class:
You can change the algorithm used via the map.sort.class value in the hadoop-default.xml.