ElasticSearch 的实际限制卡桑德拉

发布于 2024-11-15 08:05:03 字数 139 浏览 8 评论 0原文

我计划使用 ElasticSearch 来索引我的 Cassandra 数据库。我想知道是否有人看到 ElasticSearch 的实际局限性。在 PB 范围内速度会变慢吗？另外，有人在使用 ElasticSearch 索引 Cassandra 时遇到任何问题吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

瑶笙 2024-11-22 08:05:03

请参阅 this thread 来自 2011 年，其中提到了每个具有 1700 个分片的 ElasticSearch 配置200GB，在 1/3 PB 范围内。我希望 ElasticSearch 的架构能够支持几乎无限的水平可扩展性，因为每个分片索引都与所有其他分片分开工作。

实际限制（也适用于任何其他解决方案）包括首先实际加载这么多数据所需的时间。管理如此规模的 Cassandra 集群（或任何其他分布式数据存储）还将涉及大量维护、负载平衡等工作量。

回复收藏 0 原文

养猫人 2024-11-22 08:05:03

Sonian 是 kimchy 在该帖子中提到的公司。我们在 AWS 上跨多个 ES 集群拥有超过 PB 的数据。 ES 的水平扩展程度没有技术限制，但正如 DNA 提到的，存在实际问题。迄今为止最大的是网络。它适用于所有分布式数据存储。您一次只能在电线上移动这么多。当ES必须从故障中恢复时，它必须移动数据。最好的选择是在更多节点上使用更小的分片（更多并发传输），但您会面临更高的故障率和每字节成本过高的风险。

回复收藏 0 原文