用于数字运算的最快 nosql 选项？

发布于 2024-11-11 16:58:25 字数 282 浏览 4 评论 0原文

我一直认为 Mongo 的 MapReduce 功能具有出色的性能，但现在我发现它的实现速度很慢。因此，如果我必须选择一个替代方案来进行基准测试，它应该是什么？

我的软件将使得用户通常拥有数百万条记录，并且经常对数十或数百个不可预测的子集进行排序和处理。大多数使用完整数百万条记录的数据分析可以在汇总表等中完成。我最初认为 Hypertable 是一个可行的替代方案，但在进行研究时，我在他们的文档中看到他们提到 Mongo 将是一个性能更高的选择，而 Hypertable 还有其他好处。但对于我的应用程序来说，速度是我的第一要务。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

岁月打碎记忆 2024-11-18 16:58:25

首先，决定什么是“足够快”很重要。毫无疑问，有比 MongoDB 的 Map/Reduce 更快的解决方案，但在大多数情况下，您可能会面临更高的开发成本。

也就是说，在撰写本文时，MongoDB 的 map/reduce 在单个线程上运行，这意味着它不会利用所有可用的 cpu。此外，MongoDB 的原生聚合功能非常少。这将在 2.1 版之后进行更改，从而提高性能（请参阅 https://jira.mongodb。 org/browse/SERVER-447 和 http://www.slideshare.net/cwestin63/mongodb-aggregation-mongosf-may-2011）。

现在，MongoDB 擅长的是轻松扩展，尤其是在读取方面。这很重要，因为对大型数据集进行数字处理的最佳解决方案肯定是像奥古斯托建议的那样的映射/归约云。让这样的 m/r 进行数字运算，而 MongoDB 则可以高速提供所需的数据。通过添加更多 mongo 分片可以轻松解决数据库查询吞吐量过低的问题。通过添加更多 m/r 框可以解决数字处理/聚合性能太慢的问题。基本上，性能成为您为问题保留的实例数量的函数，从而决定了成本。

回复收藏 0 原文

~没有更多了~