当前位置：文江博客话题详情

INSERT Python multithreading cassandra

Cassandra 的插入性能

发布于 2024-11-06 08:22:45 字数 410 浏览 2 评论 0原文

提前抱歉我的英语。

我是 Cassandra 及其数据模型的初学者。我正在尝试在一个节点上的本地 cassandra 数据库中插入一百万行。每行有 10 列，我仅将它们插入一个列族中。

对于一个线程，该操作大约需要 3 分钟。但我想对 200 万行执行相同的操作，并保持愉快的心情。然后我尝试使用 2 个线程插入 200 万行，预计在 3-4 分钟左右会得到类似的结果。但我得到的结果是 7 分钟……是第一个结果的两倍。当我查看不同的论坛时，建议使用多线程来提高性能。这就是为什么我问这个问题：使用多线程在本地节点（客户端和服务器位于同一台计算机上）仅在一个列族中插入数据是否有用？

一些信息： - 我使用pycassa - 我已将提交日志存储库和数据存储库分离到不同的磁盘上 - 我对每个线程使用批量插入 - 一致性级别：一级 - 复制因子：1

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

东走西顾 2024-11-13 08:22:45

您有可能遇到了 python GIL，但更可能的是您做错了什么。

例如，将 2M 行放入一个批次中就是错误的做法。

回复收藏 0 原文

溺ぐ爱和你が 2024-11-13 08:22:45

尝试在多个进程中运行多个客户端，而不是线程。

然后尝试不同的刀片尺寸。

3 分钟内 1M 插入约为 5500 次插入/秒，这对于单个本地客户端来说相当不错。在多核计算机上，如果您使用多个客户端（可能插入小批量的行或单个行），您应该能够获得此数量的几倍。

回复收藏 0 原文

海的爱人是光 2024-11-13 08:22:45

你可能会考虑Redis。它的单节点吞吐量应该更快。但它与 Cassandra 不同，因此它是否是合适的选项将取决于您的用例。

回复收藏 0 原文

记忆之渊 2024-11-13 08:22:45

由于插入的数据量是原来的两倍，因此所花费的时间加倍。您是否有可能受到 I/O 限制？

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

赏烟花じ飞满天

文章 0 评论 0

独守阴晴ぅ圆缺

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文