当前位置：文江博客话题详情

scala中的spark sql有多快？

发布于 2022-09-13 00:12:16 字数 207 浏览 38 评论 0

数据库为hive，执行一句group by 语句，测试不同方式的效率：
第一种，用impalajdbc方式，返回arraylist，耗时10s
第二种，用spark.format.jdbc方式，返回dataframe，耗时3分钟；

开发语言均为scala，为啥差异那么大？

是不是有更好的方法提升执行效率
如果涉及多表关联，是否第一种方法依旧优于第二种方法？

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

暂无简介

0 文章

0 评论

24 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0