在 HBase 中获取除给定行集之外的所有行的最有效的网络方法是什么?
假设我有一组行键(作为一个集合)。为除此集中的行之外的所有行获取特定列族的最网络有效方法是什么?
Possible Duplicate:
What is the most network efficient method of fetching a set of rows in HBase?
Say that I have a set of row keys (as a Set). What is the most network efficient method of fetching a particular column family for all rows except the ones in this set ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果该集合与总行数相比较小,则只需获取所有行并在客户端代码中进行过滤即可。 hbase 扫描器非常高效,并且具有可配置的结果缓存缓冲区以减少 RPC 调用。
您可以过滤返回给客户端的数据集,但是该数据集将被发送到所有节点,因此该数据的网络流量将乘以可能保存该数据的节点数量。
您可以为每个键的扫描添加过滤器。
If the set is small compared to the total rows then just get all and filter in the client code. The hbase scanner is efficient and has configurable result caching buffer to reduce RPC calls.
You can filter the set returned to the client however this set will be sent to all nodes so the network traffic for this data will be multiplied across the number of nodes potentially holding the data.
You can add a filter to the scan for each key.