当前位置：文江博客话题详情

与 RDBMS 相比，使用 CouchDB 时需要多少存储空间？

发布于 2024-09-14 06:21:41 字数 454 浏览 13 评论 0原文

我需要知道使用 CouchDB 实现解决方案时需要考虑的因素。我知道 CouchDB 不需要规范化，并且我在 RDBMS 开发中使用的标准技术大部分都被丢弃了。

但具体涉及的成本是多少。我完全理解其中的好处，但存储成本让我有点紧张，因为 CouchDB 似乎需要大量的复制数据，其中一些数据在使用之前就已经过时了。如何管理陈旧数据？

我知道我可以使用 Couchdb 实现一些糟糕的文档关系模型并降低存储成本，但这不会违背 Couchdb 的目标和我可以获得的性能吗？

我正在考虑的一个例子是请求、订购和招标系统。该系统当前正在发生一对多的事情，并且许多事情可能比一个事情更新得更频繁。

任何帮助都会很棒，因为我是一个老派 RDBMS 人员，接受了 CJ Date、EF Codd 和 RF Boyce 的所有教导，目前正在努力解决文档存储的激进概念。

Couchdb 有内部的东西来管理重复数据的识别和减少吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夕嗳→ 2024-09-21 06:21:41

只有您知道您将使用多少数据副本，因此不幸的是，唯一好的答案是构建模拟数据集并测量磁盘使用情况。

此外，与文件系统类似，CouchDB 需要额外的元数据存储空间。此成本取决于两个因素：

更新或创建文档的频率
压缩的频率

最坏情况瞬时磁盘使用量将是数据总量乘以 2，加上压缩时 (#2) 时存在的所有旧文档修订版 (#1)。这是因为压缩会构建一个仅包含当前文档修订的新数据库文件。因此，使用将是当前数据的两个副本（来自旧文件加上新文件），加上压缩完成时等待删除的所有“浪费”旧修订。压缩后，旧文件将被删除，因此您将回收最坏情况值的一半以上。

始终运行压缩对于减少数据使用来说没有问题，但它会对磁盘 I/O 产生影响。