《超越交易的生活》实体-消息-活动模型的实践?
假期期间,我阅读了 Pat Helland 的 “交易之外的生活”(是的,假期就是那么美好:)。简而言之,它主张将事务范围限制为单个实体,然后使用能够更新实…
如何在 HBase 上将自定义比较器与 SingleColumnValueFilter 结合使用?
我正在尝试使用两个 SingleColumnValueFilter 对象返回属于该列的长值范围内的所有记录。根据 SingleColumnValueFilter 的文档,它会对列值进行字典顺…
Hbase 和 1-多关系
我有一个问题,可以用以下场景来最好地描述。 假设我有三个表 BaseCategory、Category 和 products。如果我从 RDBMS 的角度思考,那么这些表之间的关…
如何在同一集群上的 HBase 中创建表的副本?或者,如何在工作状态下操作时使用原始状态来服务请求
有没有一种有效的方法可以在同一个集群中创建 HBase 中表结构+数据的副本?显然,目标表会有不同的名称。到目前为止我发现的内容: CopyTable 作业,…
在 HBase Java 客户端中进行多次或批量获取或获取?
HBase Java 客户端是否支持多重获取(又名批量获取),有点像 memcached 多重获取?我已经在文档和互联网上搜索了至少一个小时,但找不到任何明确的信…
Cassandra、Hadoop Hive 还是 MYSQL?
我正在开发一个网络爬虫,哪个适合存储数据? Cassandra、Hadoop Hive 或 MySQL?为什么?我的 MySQL 数据库中有过去 6 个月的 1TB 数据,我需要对它…
从聚合的博客数据中检索信息,该怎么做?
我想知道如何从聚合日志中检索数据?这就是我所拥有的: - 每天大约 30GB 的未压缩日志数据加载到 HDFS(并且很快就会增长到大约 100GB) 这是我的想…
发送Hbase批量Puts压缩?
有没有办法发送一批压缩的 hbase put。 我将自动刷新设置为 false,并且使用 2MG 的 bufferSize。有没有一种方法可以压缩看跌期权,以便在一批中发送…
每个 HBase 表一个Reducer
基本上,我需要将数据路由到正确的Reducer。每个Reducer 都将是一个TableReducer。 我有以下文件 venodor1, user1, xxxx=n 供应商1、用户1、xxxx=n 供…
Hbase 的 Java ORM
任何人都知道 HBase 的良好 Java ORM 实现。这个看起来非常适合 Ruby http://www.stanford.edu/~sqs/rhino /doc/ 但找不到 Java 的。 谢谢。…
面向列的数据库(HBase、Cassandra)中的连续行 ID?
在 HBase 中设计行 ID 时,我看到了两条相互矛盾的建议(具体来说,但我认为它也适用于 Cassandra)。 将您经常聚合在一起的键分组,以利用数据局部性…
当 HBase 节点发生故障时会发生什么?
HBase 非常棒,但是... 当一个节点(爆炸/烧毁/被盗/被疯狂的 IT 撕成碎片)时,数据会发生什么? 数据丢失了吗? 集群可以自动恢复吗? 我可以在不停…
引用完整性和 HBase
您在 HBase 常见问题解答中读到的第一个示例模式是多对多关系的学生课程示例。该架构在 Student 表中有一个 Courses 列,在 Course 表中有一个 Studen…
你知道hadoop的批量日志处理工具(zohmg替代品)吗?
由于 zohmg 项目似乎已经死了(自 2009 年 11 月以来没有新的提交),我想知道你们中是否有人使用/正在使用它(取得了成功的结果)。或者您是否了解该…