Hadoop Pig排序结果；找到订单位置？

发布于 2024-12-20 12:41:18 字数 622 浏览 2 评论 0原文

我想对我的猪结果进行排序，然后能够确定某些项目在我的排序结果中的位置。示例：

mydata = LOAD 'mydata.txt' AS (label:chararray, rank_score:float);
ranked_data = ORDER mydata BY rank_score DESC;
ranked_positions = FOREACH ranked_data GENERATE label, AUTO_INCREMENT_ID;
results = FILTER ranked_data BY label = 'item1' OR label='item2';
DUMP results;

AUTO_INCRMENT_ID 在我的完美世界中会自动递增。考虑到映射器/减速器是如何相互独立的，我猜测 Pig/Hadoop 可能不支持这一点。如果没有，你能想出另一种方法来生成我的最终结果吗？

输入示例：

item1       34.33
item2       48.39
item3       93.3

所需输出：

item1       3
item2       2

原文

I want to sort my pig results, and then be able to determine where certain items are in my ordered results. Example:

mydata = LOAD 'mydata.txt' AS (label:chararray, rank_score:float);
ranked_data = ORDER mydata BY rank_score DESC;
ranked_positions = FOREACH ranked_data GENERATE label, AUTO_INCREMENT_ID;
results = FILTER ranked_data BY label = 'item1' OR label='item2';
DUMP results;

AUTO_INCREMENT_ID would auto-increment in my perfect world. Given how mappers/reducers are independent from each other, I'm guessing Pig/Hadoop may not support this. If not, can you think of another way to generate my end result?

Example input:

item1       34.33
item2       48.39
item3       93.3

Desired output:

item1       3
item2       2

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

荒人说梦 2024-12-27 12:41:18

如果将 ORDER 的并行度设置为 1，则可以在 udf 中自行自增；当然，仅使用 1 个减速器进行排序可能会产生潜在的不良影响。

（另外，我不确定你是如何获得示例输出的——输入似乎已经排序，所以 item1 应该有 id 1，item 2 应该有 id 2，对吧？你的意思是按rank_score desc 排序吗？ ？）

回复收藏 0 原文

~没有更多了~

关于作者

吝吻

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

Hadoop Pig排序结果；找到订单位置？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

琉璃梦幻

qq_4zWU6L

话少情深

西西弗的石头怪

彻夜缠绵

千寻…

友情链接

Hadoop Pig排序结果；找到订单位置？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

琉璃梦幻

qq_4zWU6L

话少情深

西西弗的石头怪

彻夜缠绵

千寻…

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。