Berkeley DB Java 版 - 大量数据的调优

发布于 2024-09-10 08:41:07 字数 263 浏览 6 评论 0原文

我需要将超过 10 亿个密钥加载到 Berkley DB 中，因此我想提前对其进行调整以获得更好的性能。使用标准配置，我现在需要大约 15 分钟才能加载 1'000'000 个密钥，这太慢了。是否有适当的方法来调整 Berkley DB 的 B+Tree（节点大小等）？

（作为比较，在调整 tokyo Cabinet 后，它在 25 分钟内加载了 10 亿个密钥）。

聚苯乙烯我正在寻找作为代码的调整技巧，而不是为正在运行的系统设置的参数（如 jvm 大小等......）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

内心激荡 2024-09-17 08:41:07

我很好奇，当 TokyoCabinet 在 25 分钟内加载 1B 个密钥时，存储的键/值的大小是多少？您使用的 I/O 系统和存储系统是什么？您使用术语“加载”来表示 1B 事务提交到永久稳定存储吗？这大约是每秒 666,666 次插入，对于我所知道的任何 I/O 系统来说，这在物理上都是不可能的。将该数字乘以键和值的大小，现在您已经无可救药地超出了物理限制。

请查看 Gustavo Duarte 的博客，了解一些有关 I/O 系统及其工作原理的信息在硬件方面工作，然后检查你的陈述。我非常有兴趣了解东京内阁到底在做什么、没有做什么。如果我不得不猜测，我会说它要么提交到操作系统中的文件系统缓存，但不将这些缓冲区刷新（fdsync（）-ing）到磁盘。

全面披露：我是 Oracle Berkeley DB（TokyoCabinet 的直接竞争对手）的产品经理，我已经使用这些数据库及其最好的硬件大约十年了，所以我既有偏见又持怀疑态度。

Berkeley DB 有可以在事务句柄上设置的标志，这些标志模仿此和其他用耐久性（ACID 中的“D”）换取速度的类似方法。

至于如何使 Berkeley DB Java Edition (BDB-JE) 更快，您可以尝试以下操作：