求助:HIVE中一张5亿的表关联3张都只有100条数据的表,怎样效率更高?谢谢
求助:HIVE中一张5亿的表关联3张都只有100条数据的表,怎样效率更高?谢谢
表 T1(a int,b varchar(100),c int,d int) 数据量5亿
表T2(a int,b varchar(100)) 数据量100条
表T3(a int,b varchar(100)) 数据量100条
表T4(a int,b varchar(100)) 数据量1000条
select
T1.a,
T1.b,
T2.b,
T3.b,
T4.b
from T1
left join T2 on T1.a=t2.a
left join T3 ON T1.c=t3.a
left join T4 ON T1.c=t4.a
需求如上的语句,直接这样跑的话,很费时间。
谢谢
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
先把t2,t3,t4全部一次性读出来,以a字段为键,b字段为内容,形成3个字典。
再找t1一一对应。