使用映射和归约技术进行排序
给定一个巨大的整数数据集,使用映射和归约技术相对于传统排序算法(例如快速排序和合并排序)有什么优势?
Given a huge data set of integers, what would be the advantages of using map and reduce techniques over traditional sorting algorithms such as quicksort and mergesort?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
Map/reduce 或多或少只是描述并行计算的(可扩展的、常见的)方式。因此,如果您想将其作为并行计算来执行,则可以将传统的排序算法(例如合并排序或快速排序)表达为映射/归约。
这不是“map/reduce 比归并排序或快速排序更好”的问题,因为 map/reduce 只是以并行方式实现归并排序或快速排序等排序算法的工具。
Map/reduce is more or less just a (scalable, common) way of describing a parallel computation. So you'd express a traditional sorting algorithm, like mergesort or quicksort, as a map/reduce if you wanted to do it as a parallel computation.
It's not a question of "is map/reduce better than mergesort or quicksort," because map/reduce is just a tool for implementing a sorting algorithm like mergesort or quicksort in a parallel way.
不要误会我的意思,MapReduce 实际上使用快速排序和合并排序等排序算法来对归约步骤的输入进行排序。 MapReduce并不是一种新的排序算法,它只是一种处理数据的方式。沿着它被排序的步骤,这只是一个很好的副作用。
Don't get me wrong, but MapReduce actually use sorting algorithms like quicksort and mergesort to sort the input for the reduce step. MapReduce is not a new sort algorithm, it is just a way to process data. And along the steps it gets sorted, that is just a nice side-effect.