数据存储区设计 - 如何模拟高效连接

发布于 2024-12-11 07:24:02 字数 1116 浏览 4 评论 0原文

我有一个关于 Google 数据库 Cloud Datastore 的设计问题。让我用一个例子来解释一下：

我有“Article”类型的实体，具有以下属性：

title
userId
....
sumOfScore

SumOfScore 应该是所有相关“分数”实体的总和，其中有属性如：

articleId
userId
score

在伪 SQL 中：
sumOfScore = select sum(score) from Score where Score.articleId = Article.id

我看到设计这个的两种可能性（使用 Google 的数据存储 API）：

1.) 文章没有属性 sumOfScore；但查询总是：

这意味着：每次阅读一篇文章时，我都需要对这篇特定文章进行查询以计算 sumOfScore。想象一下向用户显示的包含 100 篇文章的列表。这将需要对数据库进行额外的 100 次查询，只是为了显示每篇文章的分数。

尽管如此：在使用关系数据库时，这将是我的首选方式。无冗余且标准化良好。通过 SQL，您只需使用一个连接选择即可捕获所有数据。但这对于 Cloud Datastore 来说感觉不太合适。

2.) 每当分数实体发生更改时，计算 sumOfScore：

这意味着：每当添加、删除或更改分数实体时，相关的文章更新 sumOfScore 属性。

优点：阅读文章时不需要额外的查询。 sumOfScore 对于实体本身来说是多余的。

缺点：每次更改分数，都会增加一次查询和一次写入（更新 Article 实体）。而且 sumOfScore 可能与实际的 Score 实体不匹配（例如，通过 DB-Console 更改值）

更有经验的人是怎么想的？对于这种情况是否有通用的最佳实践？ JPA 或 JDO 实现的幕后工作是什么？

非常感谢

莫斯

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

﹉夏雨初晴づ 2024-12-18 07:24:02

我建议您首先查看有关分片计数器的 GAE 文章。

这是一篇来自 GAE 最佳实践的文章，涉及如何处理计数器/总和。这可能有点棘手，因为每次更新元素时，您都必须使用逻辑随机选择分片计数器；当您检索计数时，您实际上是在获取一组实体并对它们求和。我已经走了这条路，但不会在这里提供有关我如何做到这一点的代码，因为我还没有对其进行战斗测试。但是，如果您只是将示例分片代码复制/粘贴到各处，您的代码可能会很快变得草率，因此，如果您决定走这条路，请创建一个抽象或类型化的计数器类来重用您的分片逻辑。

另一种选择是使用模糊计数。此方法使用内存缓存并以牺牲准确性为代价提供更好的性能。

请参阅此处标记为“瞬态且频繁更新的数据”的部分

以及最后一个选择；就是只使用SQL。它是实验性的并且刚出炉（与在 GAE 上使用有关）但这可能值得研究一下。

回复收藏 0 原文