hadoop hive window function reduce任务卡住超时(45分钟)

发布于 2021-11-29 01:19:59 字数 346 浏览 729 评论 3

求助。现有cdh5,hive版本为0.12,在对一个表大概60多成条记录进行分窗处理时(服务器配置比较高,内存256G,配置container可分配内存为130G),跑到最后一个reduce一直卡死。

最后一句日志是:org.apache.hadoop.mapred.FileInputFormat: Total input paths to process :1。

现先跑前其它数据还好好的,跑几百万条也在半小时内处理完成,后面估计是因为改动了啥配置,现在60万都跑不过去,跑几成条也很快。 怀疑是否文件损坏,使用parquet文件格式 ,hdfs高可用部署影响文件读写。

有哪位高手可以帮忙解答一下,十分感谢。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

情栀口红 2021-12-01 16:22:45

引用来自“kelson”的评论

已确认是数据的问题,我跑其它天的数据比这天的数据大几十陪都问题,而且当天的数据也并不是所有数据都跑不过去,某一系统制造的数据才有问题,但具体是哪样的数据质量问题还不确定。

牵你的手,一向走下去 2021-12-01 00:16:32

已确认是数据的问题,我跑其它天的数据比这天的数据大几十陪都问题,而且当天的数据也并不是所有数据都跑不过去,某一系统制造的数据才有问题,但具体是哪样的数据质量问题还不确定。

哑剧 2021-11-30 10:43:15

同问!

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文