hbase有最大版本号吗?
如果我想插入表中:
row | fam:qualifier | timestamp | value
1 | foo:bar | 12345 | 2
1 | foo:bar | 12346 | 3
1 | foo:bar | 12347 | 2
1 | foo:bar | 12348 | 1
.
.
.
1 | foo:bar | 123410 | 2
我可以在 hbase shell 中指定从特定行获取的最大版本数,但是当我指定“100”时,它只返回 4 个版本... 有上限吗?
If I want to insert in a table:
row | fam:qualifier | timestamp | value
1 | foo:bar | 12345 | 2
1 | foo:bar | 12346 | 3
1 | foo:bar | 12347 | 2
1 | foo:bar | 12348 | 1
.
.
.
1 | foo:bar | 123410 | 2
I can specify in the hbase shell the maximum number of version to get fom a specific row but when I specify for instance '100' it return me only 4 versions...
Is there any maximum?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
它只返回 4 个版本,因为列族设置为最多存储 4 个版本。
如果您想存储更多版本,则需要更改 CF。使用 hbase shell:
最大版本的默认值为 1*:
http://hbase.apache .org/book/schema.versions.html
*似乎最大版本的默认值在某些时候从 3 更改为 1。
It only returns 4 versions because the column family is set to store a maximum of 4 versions.
If you want to store more versions you need to alter the CF. Using the hbase shell:
The default for max versions is 1*:
http://hbase.apache.org/book/schema.versions.html
*It seems the default value for max versions was changed from 3 to 1 at some point.
答案是部分正确的。不正确:hbase 存储三个版本。证明见下。
正确:您可以设置 hbase 返回的最大版本数
但是现在让我们假设,我没有更改版本变量。
我的 hbase 中有 10 个条目,时间戳从 0 到 9。
最新的时间戳是:
显示的从时间戳 1 到 5 的值是:
... 当我将结束时间戳设置为 10 时,它仍然只显示该时间戳之前的最后三个版本并抑制前面的版本:
the answer is partly right. Not true: hbase STORES three versions. Proof see below.
True: you can set the maximum amount of versions which hbase returns through
But for now let's assume, I didn't change the version variable.
I have ten entries in my hbase, with timestamps from 0 to 9.
The most current timestamp is:
The values from timestamp 1 to 5 that are shown are:
... and when i set my end timestamp to 10, it still shows only the last three versions BEFORE that timestamp and suppresses the former ones:
版本的概念严格保留在列族级别。它是一个可配置的参数。
版本越多,同时从多个 HFile 读取数据的机会就会增加。
最好的方法是维护最低版本并将数据封装在一个 blob 中。
Concept of version is tightly maintained at column family level . Its a configurable parameter .
The more versions one has, while fetching chances of reading data from multiple HFiles increases .
The best way would be to maintain minimum version and encapsulate data in one single blob .