当前位置：文江博客话题详情

非规范化如何提高数据库性能？

发布于 2025-01-10 00:14:43 字数 142 浏览 0 评论 0原文

我听说过很多关于非规范化的内容，它是为了提高某些应用程序的性能而进行的。但我从来没有尝试过做任何相关的事情。

所以，我只是好奇，规范化数据库中的哪些地方会使性能变差，或者换句话说，非规范化原则是什么？

如果我需要提高性能，如何使用此技术？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

思念绕指尖 2025-01-17 00:14:43

非规范化通常用于：

避免一定数量的查询
删除一些连接

非规范化的基本思想是添加冗余数据或对一些数据进行分组，以便能够以更小的成本更轻松地获取这些数据；这对表演来说更好。

一个简单的例子？

考虑博客的“帖子”和“评论”表
- 对于每篇帖子，“评论”表中都会有几行
- 这意味着要显示具有相关评论数量的帖子列表，您必须：
  - 执行一个查询即可列出帖子
  - 对每个帖子执行一次查询来计算其评论数量（是的，这些评论可以合并为一个，以便一次获取所有帖子的数量）
  - 这意味着多个查询。
现在，如果您将“评论数”字段添加到“帖子”表中：
- 您只需要一个查询即可列出帖子
- 并且无需查询 Comments 表：评论数已非标准化到 Posts 表。
- 仅一个查询多返回一个字段比多个查询要好。

现在，有一些成本，是的：

首先，这会在磁盘和内存中占用一些空间，因为您有一些冗余信息：
- 评论数存储在 Posts 表中
- 您还可以在评论表中找到这些数字
其次，每次有人添加/删除评论时，您必须：
- 当然是保存/删除评论
- 此外，还要更新“帖子”表中的相应编号。
- 但是，如果阅读您博客的人数多于撰写评论的人数，那么情况可能还不错。

回复收藏 0 原文

深居我梦 2025-01-17 00:14:43

非规范化是一种时间-空间权衡。规范化数据占用更少的空间，但可能需要连接来构造所需的结果集，因此需要更多时间。如果它是非规范化的，数据会被复制到多个地方。这样会占用更多空间，但可以轻松获得所需的数据视图。

还有其他时空优化，例如

非规范化视图
预计算列

与任何此类方法一样，这可以改进读取数据（因为它们随时可用），但更新数据成本变得更高（因为您需要更新复制或预先计算的数据）。

回复收藏 0 原文

断爱 2025-01-17 00:14:43

“非规范化”这个词会导致设计问题的混乱。试图通过非规范化获得高性能数据库就像试图开车离开纽约到达目的地一样。它不会告诉你该走哪条路。

您需要的是一种良好的设计准则，一种能够产生简单而合理的设计的准则，即使该设计有时与规范化规则相冲突。

星型模式就是这样的一种设计规则。在星型模式中，单个事实表充当星型表的中心。其他表称为维度表，它们位于架构的边缘。维度通过类似于车轮辐条的关系连接到事实表。星型模式基本上是一种将多维设计投射到 SQL 实现上的方法。

与星型模式密切相关的是雪花模式，它稍微复杂一些。

如果您有一个良好的星型模式，您将能够通过不超过三路联接（涉及二维和一个事实表）获得多种数据组合。不仅如此，许多 OLAP 工具将能够自动解读您的星型设计，并为您提供对数据的点击、向下钻取和图形分析访问，无需进一步编程。

星型模式设计有时会违反第二范式和第三范式，但它可以提高报告和摘要的速度和灵活性。它最常用于数据仓库、数据集市和报告数据库。通常，与随意的“非规范化”相比，星型模式或其他一些面向检索的设计会获得更好的结果。

回复收藏 0 原文

深海少女心 2025-01-17 00:14:43

非规范化的关键问题是：

决定复制哪些数据以及原因
规划如何保持数据同步
重构查询以使用非规范化字段。

最简单的非规范化类型之一是将身份字段填充到表中以避免连接。由于身份永远不会改变，这意味着保持数据同步的问题很少出现。例如，我们将客户端 ID 填充到多个表中，因为我们经常需要由客户端查询它们，并且在查询中不一定需要客户端表和我们正在查询的表之间的表中的任何数据如果数据完全标准化。您仍然需要执行一次联接来获取客户端名称，但这比联接 6 个父表来获取客户端名称要好，因为这是您需要从正在查询的表外部获取的唯一数据。

但是，除非我们经常在需要中间表中的数据的情况下进行查询，否则这样做没有任何好处。

另一种常见的非规范化可能是将名称字段添加到其他表中。由于名称本质上是可变的，因此您需要确保名称与触发器保持同步。但是，如果这可以让您免于连接 5 个表而不是 2 个表，那么稍微长一点的插入或更新的成本是值得的。

回复收藏 0 原文

迷乱花海 2025-01-17 00:14:43

如果您有某些要求，例如报告等，它可以帮助您以各种方式对数据库进行非规范化：

引入某些数据重复来为自己节省一些连接（例如，将某些信息填充到表中并可以处理重复的数据，因此该表中的所有数据不需要通过连接另一个表来找到）
您可以预先计算某些值并将它们存储在表列中，而不是每次查询数据库时动态计算它们。当然，随着时间的推移，这些计算值可能会变得“陈旧”，您可能需要在某个时候重新计算它们，但仅读出固定值通常比计算某些内容（例如计算子行）要便宜

当然还有更多方法对数据库模式进行非规范化以提高性能，但您只需要意识到这样做确实会给自己带来一定程度的麻烦。在做出这些决定时，您需要仔细权衡利弊 - 性能优势与您遇到的问题。

回复收藏 0 原文