Mapreduce值列表顺序问题

发布于 2024-12-06 18:07:44 字数 268 浏览 1 评论 0原文

正如我们所知，Hadoop 按每个键对值进行分组，并将它们发送到相同的reduce 任务。假设我在 hdfs 上的文件中有下一行。第1行第2行 3号线 .... 亚麻布在地图任务中，我打印文件名和行。在reduce中，我收到不同的订单。例如 key=> { 第 3 行，第 1 行，第 2 行，....} 现在，我有下一个问题。我想获取这个值列表以便它们位于文件中，作为 key =>{ line1, line2,...linen} 有什么办法可以做到这一点吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

偏爱你一生 2024-12-13 18:07:44

如果您使用 TextInputFormat，您将获得作为映射器输入。 LongWritable 部分（或键）是文件中行的位置（不是行号，而是我认为从文件开头开始的位置）。您可以使用该部分来跟踪哪一行是第一行。例如，映射器可以输出作为输出，而不是像您现在所做的那样。然后，您可以根据对的第一部分（位置）对减速器获取的键进行排序，并且您应该以相同的顺序返回行。