数据仓库搭建
最近在探索数据仓库搭建,同时也要考虑对接离线计算和实时计算,不知道大家有没有好的方案提供,hive的话查询时间较长,不适合BI人员sql立即查看执行结果,不知有没有其他好的方案提供
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
最近在探索数据仓库搭建,同时也要考虑对接离线计算和实时计算,不知道大家有没有好的方案提供,hive的话查询时间较长,不适合BI人员sql立即查看执行结果,不知有没有其他好的方案提供
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
要兼容BI使用sql的习惯,还要加速hive查询,可以考虑使用hive外部表,将数据存储到hbase中,第一是提高数据写入性能,第二是提升针对主键查询的性能,然后使用sparksql,替换hive离线分析方式,将数据加载到内存,可明显提升查询性能,但要注意,sparksql主要负责查询,不负责数据写入,所以若要写入,要写到hive上