在不添加更多hdfs服务器的情况下添加更多hbase服务器是否有益?

发布于 2024-11-09 04:13:22 字数 87 浏览 1 评论 0原文

我正在使用 Eucalyptus,并正在考虑将 hdfs 和 hbase 放在我们的节点控制器上。在我们的某些实例上运行 hbase 会提高性能吗?还是多余的?

I'm using Eucalyptus and am considering putting hdfs and hbase on our node controllers. Would running hbase on some of our instances improve performance, or is it redundant?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

夜未央樱花落 2024-11-16 04:13:22

这取决于。与往常一样,存在三个基本瓶颈:

1) CPU

2) 网络 I/O

3) 磁盘 I/O

如果您的应用程序当前受 CPU 限制,或者如果您的数据在额外节点上具有较高的缓存命中率,则需要额外的 HBase 节点很有用。如果您的应用程序主要受磁盘限制或网络限制,那么额外的 HBase 节点不会有太大帮助(除非添加更多节点显着提高缓存命中率)。

一般来说,您希望 hbase 节点在 hdfs 节点上运行,以便它可以利用本地数据访问。我会发现其他情况有些不寻常。

It depends. As always there are three fundamental bottlenecks:

1) CPU

2) Network I/O

3) Disk I/O

If your application is currently CPU bound, or if you data has a high cache hit rate with the extra nodes, then extra HBase nodes are useful. If your application is mostly disk bound, or network bound, then extra HBase nodes wouldn't help much (unless adding more nodes significantly improves your cache hit rate).

In general, you want your hbase nodes to run on hdfs nodes so that it can take advantage of local data access. I would find other situations somewhat unusual.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文