对于Spark-Phoenix,我不想从HBase中获取全部数据。有什么方法可以根据我的状况从表格中获取数据?
从HBASE中获取整个数据太慢。我只需要处理一个小时的数据。 因此,我想知道我是否可以在配置中指定SQL并将Spark支持对JDBC连接的支持等数据?否则它支…
HBASE区域分裂出乎意料,每个区域大小小于1g
hbase.hregion.max.filesize 是10g。 拆分策略是 SteppingsPlitPolicy 。 该表由Phoenix与 salt_buckets = 6 创建。 根据 steppingsplitpolicy 的源…
Google Boogtable二级指数
在审查Google Boogtable时,我发现它没有定义次要索引的能力。 因此,如果您有十亿美元的交易,对于1000万客户来说,似乎您需要进行全桌扫描才能为一…
sqlexception:没有找到适合JDBC的驱动程序:Phoenix :(主机)
我正在运行一个Spark-Submit命令,该命令将通过Scala类进行一些数据库工作。 spark-submit --verbose --class mycompany.MyClass --conf spark.driver…
通过火花流和删除Phoenix/HBase数据接收KAFKA消息
在我的项目中,我有当前的工作流程: kafka消息=>火花流/处理=>将/更新插入HBase和/或Phoenix ,插入和更新操作直接或通过Phoenix使用(我测…
Phoenix表由复合行键拆分
在 Phoenix 中使用复合主键创建表时是否可以指定区域分割值?例如: CREATE TABLE TEST_TABLE(A VARCHAR, B VARCHAR CONSTRAINT PRIMARY KEY (A,B)) S…
如何将数据批量加载到 Apache Phoenix 5.1.2。使用 Apache Spark 3.2.1?
我正在尝试将 CSV 文件(每个 30 - 300 GB)批量加载到 Apache Phoenix 表中。我正在尝试使用 Apache Spark 插件 (https://phoenix.apache.org/phoeni…
Hadoop 中的 JoGL? Hadoop 用于图形处理?
阅读此和这篇论文,我决定要为大型应用实现分布式体渲染设置MapReduce 上的数据集作为我的本科论文工作。 Hadoop 是一个合理的选择吗? Java 是否会扼…
- 共 1 页
- 1