使用 MongoDB 作为我们的主数据库，我应该使用单独的图数据库来实现实体之间的关系吗？

发布于 2024-11-03 16:28:51 字数 612 浏览 1 评论 0原文

我们目前正在为一家专业公司内部实施类似 CRM 的解决方案。由于存储信息的性质以及信息的不同值和键，我们决定使用文档存储数据库，因为它完全适合目的（在本例中我们选择 MongoDB）。

作为此 CRM 解决方案的一部分，我们希望存储实体之间的关系和关联，示例包括存储利益冲突信息、股东、受托人等。以最有效的方式将所有这些实体连接在一起，我们确定有必要建立一个“关系”的中心模型。所有关系都应附加历史信息（开始和终止日期）以及不同的元数据；例如，股东关系还包含持有的股份数量。

由于传统的RDBMS解决方案不适合我们以前的需求，因此在我们当前的情况下使用它们是不可行的。我试图确定的是，在我们的情况下使用图形数据库是否更相关，或者实际上仅使用 mongo 的内置关系信息是否合适。

关系信息将在整个系统中大量使用。我们希望执行的一些信息查询的示例如下：

获取“xyz Limited”“客户”公司的所有“关键联系人”人员
获取“john”为股东的公司的所有其他“股东”
获取全部作为“abc Limited”的“客户”和“trust usbank Limited”的客户的实体的“关键联系人”人员

鉴于这种“树”关系结构，使用图形数据库（例如 Neo4j）是否更合适？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

季末如歌 2024-11-10 16:28:51

迈克，

您应该能够将关系数据存储在图形数据库中。它在遍历大图时的高性能来自于局部性，即您不全局运行查询，而是启动一组节点（在您的情况下等于文档，通过索引查找。您甚至可以存储起始节点-用于在 mongo 文档中快速访问的 ids）。从那里您可以在恒定时间内遍历任意大的路径（关于数据集大小）。

您的其他要求是什么（即数据集大小、并发访问数量等、关系/图形复杂性）。

您的查询非常适合图形数据库，并且可以轻松地用其术语表达。

我建议您获取像 Neo4j 这样的 graphdb，并对您的域进行快速峰值以验证总体可行性，并在投资第二种技术之前找出您希望回答的其他问题。

PS 如果您还没有开始，您也可以使用纯 graphdb 方法，因为图数据库是文档数据库的超集。无论如何，您宁愿谈论您的案例中的域，而不仅仅是通用文档。（例如 structr 是构建在 Neo4j 之上的 CMS）。

回复收藏 0 原文

累赘 2024-11-10 16:28:51

MongoDB 中的文档非常类似于 Neo4j 中的节点，只是缺少关系。它们都拥有键值属性。如果您已经选择使用 MongoDB，那么您可以使用 Neo4j 来存储关系，然后在应用程序中桥接存储。如果您选择新技术，则可以使用 Neo4j 来处理所有事情，因为节点可以像文档一样保存属性数据。

至于关系部分，Neo4j 非常适合。你有一个图表，而不是不相关的文件。使用图形数据库在这里非常有意义，并且示例查询都写有图形。

但老实说，找出最适合您的方法的最佳方法是进行 PoC——低成本、高价值。

免责声明：我在 Neo Technology 工作。

回复收藏 0 原文

找个人就嫁了吧 2024-11-10 16:28:51

继续使用 mongodb。有两个原因 - 1. 如果可以降低复杂性，最好留在同一个域中；2. mongodb 非常适合查询，并且比 redis 需要更少的工作。

回复收藏 0 原文

情话已封尘 2024-11-10 16:28:51

我们最终使用了两者，我们正在为交通网络实现一个搜索引擎。

一旦超过 1 或 2 个“链接”，尝试在 MongoDB 中实现关系可能会变得笨拙。本质上，您将把 objectid 存储在一个数组中，如果您想实现双向关系，那么您必须实现两个单独的链接。在 Mongo 中，指向实体（或“链接”）的“指针”只是另一个文本属性（可以有不同的解释），它不是像 Neo4j 中的关系那样的第一类对象。

因此，我们决定使用 Neo4j 来存储关系，并使用 MongoDB 来存储其他所有内容。接下来的挑战就变成了保持两家商店的同步。

我们正在使用一个名为“MongoConnector”的 10gen 实验室项目，它是保持 MongoDB 与另一个存储同步的机制。该项目目前不受支持，但代码可用：

http://blog.mongodb .org/post/29127828146/introducing-mongo-connector

MongoConnector使用副本机制来实现同步。本质上，您正在监视 MongoDB OpLog，并且正在为任何更新插入（更新或插入）和删除实现回调。这个实现在 MongoConnector 中被称为“DocumentManager”。我们结束了 Neo4jDocumentManager 的实现。

在查询方面，我们发现 Neo 更适合“朋友的朋友”类型的查询，而 MongoDB 更适合通用查询，即。处理日期的每个字段或范围查询。

我一直计划进行一次演讲和一篇博客文章，但我还没有开始：

http://www.meetup.com/graphdb-boston/events/91703472/

此解决方案有一些缺点，例如如果进程出现故障或同步缓慢（不是实时）。