当前位置：文江博客话题详情

cassandra pycassa

Cassandra 多重获取性能

发布于 2024-11-02 14:29:18 字数 353 浏览 3 评论 0原文

我有一个 cassandra 集群，行数相当少（大约 200 万行，我希望这对于 cassandra 来说是“小”）。每行都以唯一的 UUID 为键，每行大约有 200 列（或多或少）。总而言之，这些都是非常小的行，没有二进制数据或大量文本。只是短字符串。

我刚刚完成从旧数据库到 cassandra 集群的初始导入。我已经在每台机器上对 cassandra 进行了调优。有数亿次写入，但没有读取。现在是时候使用这个东西了，我发现读取速度绝对令人沮丧。我正在使用 pycassa 一次对 500 到 10000 行进行多重获取。即使有 500 行，性能也很糟糕，有时需要 30 秒以上。

什么会导致这种行为？在这样的大规模进口之后，您会推荐什么样的东西？谢谢。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

夏至、离别 2024-11-09 14:29:18

听起来你是 io 瓶颈。如果您的数据适合 RAM，Cassandra 每个核心的读取速度约为 4000 次/秒。否则你就会像其他事情一样被寻求所束缚。

我注意到，通常情况下，“彻底调整”系统是在您开始向系统施加负载之后保留的。 :)

请参阅：

回复收藏 0 原文

笑咖 2024-11-09 14:29:18

是否可以选择将多重获取分成更小的块？通过这样做，您将能够将您的获取分布在多个节点上，并可能通过在节点之间分布负载和反序列化较小的数据包来提高性能。

这引出了下一个问题，您的读取一致性设置为多少？除了 @jbellis 提到的 IO 瓶颈之外，如果您需要特别高的一致性，您还可能会遇到网络流量问题。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文