JOIN ... ON ... JOIN ... on ... on .... VS. ...加入...加入... on ...和

发布于 2025-01-26 11:32:30 字数 456 浏览 2 评论 0原文

我最近优化了一个看起来像这样的HIVEQL请求(BY 300X):

  SELECT * FROM a
        LEFT JOIN b
        LEFT JOIN c
        LEFT JOIN d
        ON a.col1 = b.col2 AND
        b.col3 = c.col4 AND 
        c.col5 = d.col6

对此:

    SELECT * FROM 
        a LEFT JOIN b ON a.col1 = b.col2
        LEFT JOIN c ON b.col3 = c.col4
        LEFT JOIN d ON c.col5 = d.col6

后者代码在SQL中总是更快,还是在HADOOP MAP/减少Hive的操作中可以使用某些东西?

I recently optimized a HiveQL request (by > 300x) that looked something like this:

  SELECT * FROM a
        LEFT JOIN b
        LEFT JOIN c
        LEFT JOIN d
        ON a.col1 = b.col2 AND
        b.col3 = c.col4 AND 
        c.col5 = d.col6

To this:

    SELECT * FROM 
        a LEFT JOIN b ON a.col1 = b.col2
        LEFT JOIN c ON b.col3 = c.col4
        LEFT JOIN d ON c.col5 = d.col6

Is the latter code always faster in SQL or does it have something to with the Hadoop Map/Reduce operations in Hive ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文