当前位置：文江博客话题详情

hive表计算总数不正确

发布于 2021-12-04 21:30:26 字数 543 浏览 776 评论 5

我有一张hive表，按照时间分区(分区字段time)，有几天的数据
select count(*) from table_Name;
结果显示320多万数据，这明显不正确
select count(*),time from table_Name group by time order by time;
结果计算每个分区的条数，只算到了96个分区的数据，后面的每个分区条数没有计算。
为了看后面的一个分区是不是不能计算，
select count(*) from table_Name where time='2017-11-11-06-5';
显示28361条数据。
后来计算每天的条数
select count(*) from table_Name where time between time1 and time2;
数据分别是214万多，232万，327万，753万。。。
每天计算也没有问题，但是计算整张表的数据就不行，即使加上分区限制求几天的数据总条数，算的也是不正确，一直不知道为什么，求大侠指导！谢谢

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

疾风者 2021-12-10 02:27:54

10分钟一个分区，比如6点分区 06-0 06-1 06-2 06-3 06-4 06-5

网名女生简单气质 2021-12-10 00:48:46

回复
感觉是分区字段的问题，我们是按天分区，没遇到过这个问题

躲猫猫 2021-12-10 00:23:29

猜测之一：是不是有topo（storm将kafka数据写到hive）一直在运行，而hive挂了，重启hive服务时没有关闭topo。你们的hive挂了对数据没有影响吗？

多彩岁月 2021-12-10 00:10:21

回复
我们这也是storm一直在从kafka里拿出去塞到hive里，不过现在改成spark了，区别在于我们直接用程序判断数据放到哪个分区，然后直接把数据塞到对应分区里，hive挂了无所谓，只要hadoop不挂就没事

奢华的一滴泪 2021-12-08 13:58:58

你得time格式好奇怪2017-11-11-06-5，6点5分？

~没有更多了~

关于作者

少女情怀诗

暂无简介

0 文章

0 评论

484 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苦中寻乐

文章 0 评论 0

lueluelue

文章 0 评论 0

嗼ふ静

文章 0 评论 0

王权女流氓

文章 0 评论 0

与花如笺

文章 0 评论 0

残酷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文