当前位置：文江博客话题详情

我们是否在表中记录重复的数据或继续连接所有未来的读取？

发布于 2024-10-13 18:49:07 字数 236 浏览 3 评论 0原文

说一个用户活动表。至少您需要 user_id、datetime、activity_id、object_id 等内容。我可以与对象表结合起来找到对象所有者。我可以加入活动表来查找活动组、类型等。

或者

我也可以在运行时将这些详细信息复制到活动表中。这仅意味着重复数据，但将来每当我需要阅读时，我不必继续加入。我现在将所有数据都存储在活动表中，以获取所有可能的数据。

如果我复制数据，我是使用 FK 还是独立复制？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

狼性发作 2024-10-20 18:49:07

当然，数据库应该规范化，因为它们性能更好，SQL 是为规范化结构以及连接它们而设计的。没有理由“去常态化”。

然而，有一种情况有特殊需要。历史表或日志文件。需要考虑的问题是，当你查询这张表时，是否需要父对象当前的数据；或者这是当时发生的情况的真实日志，并且您需要创建日志行时的最新数据。

在后一种情况下，由于存储此类数据有明确的目的，因此它实际上不是重复的，也不是标准化的逆转；因此，将数据分类为重复或“非规范化”是不正确的。这只是审计数据，必须保留。一般来说，日志文件（这就是它们的本质；为了方便起见，我们将它们存储在数据库中）不是数据库的一部分，并且数据库规则不适用。

但始终对它们实施索引，并定期清除它们；否则就会变成怪物。

日志文件的替代方案是历史表。这是根据需要在表的基础上实现的，而不是操作的日志文件。对于必须保留变更审核的每个表，实施该表的“副本”。这存储已更改的行的前图像。 DDL 与源表完全相同，但增加了一项：PK 添加了 TIMESTAMP 或 DATETIME 列。同样，这是根据明确的要求，将这些表分类为重复或“非规范化”是不正确的。

历史表优于日志文件，因为它们仅存储已更改的行；而日志文件则重复存储不变的数据。由此产生的存储数据量差异很大。

▶历史表格示例◀