对 HBase 表进行批量放入时出现 RejectedExecutionException
我正在尝试将行批量放入 HBase (0.90.0) 中,大小约为 1000(行),我有多个生产者线程将数据写入队列,还有一个消费者线程每隔几分钟唤醒一次,并写…
比较字符串或字节数组更快吗?
所以,可能听起来像是一个奇怪的问题,但是比较 2 个字符串或 byte[] 的速度更快吗(使用 Arrays.equals())?我正在使用 Hadoop/Hbase,我从 Hbase 获…
使用比较过滤器的 HBase 扫描在返回最后一行时有很长的延迟
我的 HBase 在独立模式下运行,并且在使用 Java API 查询表时遇到了一些问题。 该表有几百万个条目(但可能会增长到数十亿个),它们具有以下行关键指…
如何防止 Hbase 覆盖单元格中的现有值?
任何人都可以解释如何防止 hbase 更新具体列和键中的单元格(如果值已存在)? 例如,当并行的两个进程写入 VERSIONS = 1 的同一个单元格时,只有最后…
当我将包含许多列的行插入 HBase 时,为什么这么慢?
我想将数据从数据库插入到HBase中, 但是一行多列(超过五十列,只有一个列族)。 我有4个区域服务器,但是插入的性能 小于 10000 行/秒。 我能做些什…
数据库。大行中的顺序列读取。是否可以?
我以单节点模式使用HBase。我的表中的行很大。我必须使用 Java API 按顺序读取所有行中的所有列。但是 Get 和 Scan 操作返回整行(结果包含该行中的所…
通过 Thrift(在 Ruby 中)在 Hbase 扫描器中通过正则表达式选择列
文档建议我应该能够传递正则表达式作为列限定符。 我在列族“C”中有一个名为“F1:I”和“F2:I”的列。请考虑以下情况: columns = ['C:F1:I'] scanne…
HBase数据丢失?缺少 HDFS 附加支持?在没有启用 HDFS 附加支持的情况下运行 HMaster?
我正在使用 HBase。我已经安装并运行了分布式环境。 但是,它在 HMaster 的界面页面中显示警告: “您当前正在运行 HMaster,没有启用 HDFS 附加支持…
将 datanucleus-rest 与 HBASE 结合使用
我正在尝试运行 datanucleus REST 服务 (2.0.1)与 HBASE (0.90.2)。 然而,当访问 servlet(注册有效)时,我收到 503: HTTP 错误 503 访问 /dn/ 时…
HBase Thrift API 的现状
有谁知道 HBase Thrift API 的当前状态是什么? 我对通过这个 API 编写 PHP 来与 HBase 一起工作特别感兴趣,首先这个 API 缺乏对一些重要功能的支持…
HBase/Zookeeper 安装问题
我在 Ubuntu 11.04 上安装 hbase 时遇到问题。我是 ubuntu 的新手,实际上是一个菜鸟!最近,我在笔记本电脑上安装了 hadoop-0.20.2,并使用单集群配…
实时查询/聚合数百万条记录 - hadoop?数据库?卡桑德拉?
我有一个可以并行化的解决方案,但我(还)没有 hadoop/nosql 的经验,并且我不确定哪种解决方案最适合我的需求。理论上,如果我有无限的 CPU,我的结…
HBase过滤器继承咨询
我需要一个有点像 TimestampsFilter 的过滤器,只不过它需要一个时间帧并在该帧内应用带有时间戳的每一行。 这是我的实现: public class TimeFilter …
HBase& Mahout - 使用 HBase 作为 Mahout 的数据存储/源 - 分类
我正在开发一个大型文本分类项目,我们将文本数据(简单消息)存储在 HBase 中。 我们有两个问题,首先我们想使用 HBase 作为 Mahout 分类器(即拜耳…