当前位置：文江博客话题详情

如何把Spark的数据导出到Greenplum？

发布于 2022-09-04 05:21:07 字数 85 浏览 26 评论 0

数据放在Spark集群的HDFS上，如何把Spark计算的结果导入到GP里面?计算后的结果存放到GP上，业务用户白天就查询GP，这样是不是速度可以更快一点。

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

回忆凄美了谁 2022-09-11 05:21:07

如果Spark写出的文件类型为Parquet、Avro或者CSV文件，可以使用gphdfs外部表读入GPDB中。如果是其它文件类型，要麻烦一些，需要定制gphdfs的序列化插件。

http://gpdb.docs.pivotal.io/4...

回复收藏 0

~没有更多了~

关于作者

慕巷

暂无简介

0 文章

0 评论

25 人气

关注发私信

隔纱相望

文章 0 评论 0

关注

昵称有卵用

文章 0 评论 0

关注

梨涡

文章 0 评论 0

关注

蓝咒

文章 0 评论 0

关注

白芷

文章 0 评论 0

关注

樱娆

文章 0 评论 0

友情链接

文江博客

如何把Spark的数据导出到Greenplum？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接

如何把Spark的数据导出到Greenplum？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。