MongoDB 中海量关系的最佳数据模型

发布于 2025-01-01 14:53:22 字数 583 浏览 0 评论 0原文

我们正在采用 MongoDB 作为新的解决方案，目前正在尝试设计最有效的数据模型来满足我们的需求，即数据项之间的关系。

我们必须在用户、项目和列表之间保持三向关系。用户可以拥有许多项目和许多列表。列表将包含一个用户和许多项目。一个项目可以属于多个用户和多个列表。后者尤其重要 - 一个项目可能属于潜在的大量列表：数千个，当然也可能是数万或数十万。未来甚至可能有数百万。我们需要能够在两个方向上导航这些关系：例如，获取列表上的所有项目或项目所属的所有列表。我们还需要通用的解决方案，以便我们可以在需要时添加更多类型的文档以及它们之间的关系。

因此，似乎有两种可能的解决方案。第一个是数据库中的每个文档都有一个由 ID 数组组成的“关系”集合。因此，列表文档将具有一个包含所有项目 ID 的项目关系集合，以及一个包含用户单个 ID 的关系集合。在此模型中，当某个项目属于许多用户或许多列表时，这些数组将变得庞大。

第二种模型需要一种新类型的文档，即存储每个合作伙伴的 ID 和关系名称的“关系”文档。这总体上会存储更多数据，因此会影响磁盘空间。它看起来也像是在 NoSQL 中解决这个问题的一种“不自然”的方式。

性能方面、空间方面、架构方面，哪个更好，为什么？

干杯，马特

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

舂唻埖巳落 2025-01-08 14:53:22

这取决于您的访问模式。

嵌入的 id 数组更适合读取。通过快速阅读，您可以获得所有相关对象的 ID，现在可以去获取它们。但如果你的更新率很高，你就会遇到一些麻烦，因为 mongodb 必须一遍又一遍地复制相同的（已经很大的）对象，因为它超出了其磁盘边界。
但是这个解决方案对于写入来说确实很糟糕。想象一下属于几百万个列表的一个项目。你决定删除它。现在您必须遍历所有这些列表并从其引用数组中提取该项目的 id。很令人兴奋，不是吗？
将引用存储为单独的文档有利于写入。添加、编辑和删除新引用的速度非常快。但这个解决方案需要更多的磁盘空间，更重要的是，需要宝贵的 RAM。而且读取速度也不那么快，尤其是当您有很多参考文献时。
考虑到您的数字（“未来可能甚至数百万”），我会选择这个解决方案。您始终可以添加一些硬件来加速查询。传统上，扩展写入是最困难的部分，在此解决方案中，写入速度快且可分片。