当前位置：文江博客话题详情

卡桑德拉有什么问题？

发布于 2024-11-06 09:05:26 字数 521 浏览 1 评论 0原文

好的。我正在阅读有关 cassandra 的文章，我读到的每一篇文章都提到，由于最终一致性，在 cassandra 中写入非常“快”。

我在 Linux 机器上设置了 cassandra，创建了模式，并使用流畅的 cassandra 客户端通过 C# 创建了客户端。好吧，它不起作用，因为我无法通过流畅的 cassandra 客户端访问远程 cassandra 实例。

所以我在Windows上安装了cassandra，创建了模式等。

接下来，我向cassandra插入了100万条条目，这花了大约12分钟。客户端和服务器位于同一台四核、8GB RAM 的机器上。

这并不快。我对 MongoDB 做了类似的测试，花了 4 分钟向其写入 100 万个文档。

我用ObjectivityOODBMS做了一个类似的测试，插入100万个对象花了30秒。

cassandra 有什么问题，根据我的测试，它速度不快？
在具有不同客户端（如 Java）的 Linux 服务器上，它的行为会有所不同吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

_蜘蛛 2024-11-13 09:05:26

除了对 Cassandra 做了一些研究之外，我没有使用过它，但使用过 MongoDB。希望这些想法/注释能有所帮助。

在一台独立机器上，使用 mongoimport，我能够在大约 6 分钟内将大约 2400 万个文档加载到 MongoDB 中。您 4 分钟写入 100 万条数据看起来确实很慢 - 因素可能是：磁盘速度/插入方式 - 例如，如果您一次插入 1 个文档，那么速度会更慢。特别是如果你使用SafeMode（我不知道Cassandra是否有同样的东西）。您应该改为通过批处理 API 之一进行插入（例如 C# 驱动程序上的 InsertBatch）。对于 Cassandra 来说也是如此（1 × 1 = 慢，批量插入 = 更快）。正是这种轻松添加节点来扩展写入/读取的能力，才真正让您全面（且公平）地了解这些技术。

显然，在独立机器上，您会遇到争用，这可能是一个因素。

需要注意的是，像 MongoDB 和 Cassandra 这样的技术使得扩展变得非常容易。例如，在 MongoDB 术语中，您可以通过使用分片来扩展写入（即增加吞吐量）。特别是当数据量更大时，能够让十几个节点同时接受写入显然将有助于改善 IO 情况并增加写入量。同样，您可以使用副本集扩展读取。

总之，我的问题是您如何插入这些文档 - 是否以最有效/批量的方式完成？

回复收藏 0 原文

~没有更多了~