对于Spark-Phoenix,我不想从HBase中获取全部数据。有什么方法可以根据我的状况从表格中获取数据?
从HBASE中获取整个数据太慢。我只需要处理一个小时的数据。
因此,我想知道我是否可以在配置中指定SQL并将Spark支持对JDBC连接的支持等数据?否则它支持下推,我只需要写SparkSQL?
我正在使用Phoenix-4.14.1-HBase-1.3。
It is too slow to pull the whole data from Hbase. I only need to process data for one hour.
So I want to know whether I can specify the SQL in config and pull one-hour data like Spark's support to JDBC connection? or it supports push-down and I just need to write the SparkSQL?
I am using phoenix-4.14.1-HBase-1.3.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
好的。我找到答案。凤凰城确实支持下推。我的错是我首先使用
substr
,应该用startswith
或喜欢
来代替。证据如下所示。
OK. I find the answer. The phoenix does support push-down. My fault is that I use
substr
at first, which should be replaced bystartsWith
orlike
.The evidence is shown below.