1万个时间字符串排序并根据连续的key计数 求解

发布于 2022-09-12 13:15:29 字数 942 浏览 35 评论 0

近期在工作中遇到一个时间排序并计数的问题,
hbase rowkey排序,rowkey:YYYYMMDDHHMMSS+类别2位+类型2位
先按时间倒序排序,再根据统一类别计数
例如:
时间:20200501185520 类别:02 类型:01,则rowkey: 202005011855200201

N个rowkey
20190501 18:55:20 02 01
20200311 17:55:20 01 01
20200521 23:55:20 04 01
20100101 18:52:20 05 01
20200501 18:53:20 07 01
20200503 07:55:20 01 01
20200501 18:51:20 02 01
20200501 11:55:20 01 01
20200504 18:55:20 02 01
20200501 10:55:20 01 01
20200501 18:55:23 02 01
20200501 18:55:20 02 01
20200501 18:55:22 03 01
20200501 08:55:20 04 01
20210301 21:55:20 02 01
20200501 11:55:20 02 01

排序并根据连续的“类别”计数后结果为
20210301 21:55:20 02 01 count:1
20200521 23:55:20 04 01 count:1
20200504 18:55:20 02 01 count:1
20200503 07:55:20 01 01 count:1
20200501 18:55:23 02 01 count:1
20200501 18:55:20 02 01 count:2
20200501 18:53:20 07 01 count:1
.
.
.
.

求解:1万条这样的数据的排序算法,或者说应该用什么排序比较好

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文