在不添加更多hdfs服务器的情况下添加更多hbase服务器是否有益?
我正在使用 Eucalyptus,并正在考虑将 hdfs 和 hbase 放在我们的节点控制器上。在我们的某些实例上运行 hbase 会提高性能吗?还是多余的?
I'm using Eucalyptus and am considering putting hdfs and hbase on our node controllers. Would running hbase on some of our instances improve performance, or is it redundant?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这取决于。与往常一样,存在三个基本瓶颈:
1) CPU
2) 网络 I/O
3) 磁盘 I/O
如果您的应用程序当前受 CPU 限制,或者如果您的数据在额外节点上具有较高的缓存命中率,则需要额外的 HBase 节点很有用。如果您的应用程序主要受磁盘限制或网络限制,那么额外的 HBase 节点不会有太大帮助(除非添加更多节点显着提高缓存命中率)。
一般来说,您希望 hbase 节点在 hdfs 节点上运行,以便它可以利用本地数据访问。我会发现其他情况有些不寻常。
It depends. As always there are three fundamental bottlenecks:
1) CPU
2) Network I/O
3) Disk I/O
If your application is currently CPU bound, or if you data has a high cache hit rate with the extra nodes, then extra HBase nodes are useful. If your application is mostly disk bound, or network bound, then extra HBase nodes wouldn't help much (unless adding more nodes significantly improves your cache hit rate).
In general, you want your hbase nodes to run on hdfs nodes so that it can take advantage of local data access. I would find other situations somewhat unusual.