当前位置：文江博客话题详情

database-design database database-normalization

更好的数据库设计是：更多的表还是更多的列？

发布于 2024-07-06 05:06:36 字数 221 浏览 13 评论 0原文

一位前同事坚持认为，具有更多表且每个列较少的数据库比具有较少表且每个列较多的数据库更好。例如，您将拥有姓名表、地址表、城市表等，而不是包含姓名、地址、城市、州、邮政编码等列的客户表。

他认为这种设计更加高效和灵活。也许它更灵活，但我没有资格评论它的效率。即使效率更高，我认为这些收益可能会被增加的复杂性所抵消。

那么，与更少列更多的表相比，更多列更少的表有什么显着的好处吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（18）

骷髅 2024-07-13 05:06:36

如果这些一对一的关系将来可能变成一对多或多对多，那么多表数据库就会灵活得多。例如，如果您需要为某些客户存储多个地址，那么如果您有一个客户表和一个地址表，就会容易得多。我真的看不出您可能需要复制地址的某些部分而不是其他部分的情况，因此单独的地址、城市、州和邮政编码表可能有点过头了。

回复收藏 0 原文

话少心凉 2024-07-13 05:06:36

当您设计数据库时，您应该尽可能接近数据的含义，而不是您的应用程序需求！

一个好的数据库设计应该可以保持 20 年以上而不发生任何变化。

一个客户可能有多个地址，这就是现实。如果您决定您的应用程序在第一个版本中仅限于一个地址，那么请关注您的应用程序的设计而不是数据！

如果您想简化查询，最好使用多个表而不是多个列并使用视图。

大多数时候，您会遇到数据库性能问题，这与网络性能有关（具有一行结果的链式查询、获取不需要的列等），而不是与查询的复杂性有关。

回复收藏 0 原文

简美 2024-07-13 05:06:36

表格的列数较少有一些优点，但您还需要查看上面的场景并回答以下问题：

是否允许客户拥有超过 1 个地址？如果不是，则不需要单独的地址表。如果是这样，那么单独的表就会变得很有帮助，因为您可以根据需要轻松添加更多地址，而向表中添加更多列会变得更加困难。

回复收藏 0 原文

南薇 2024-07-13 05:06:36

我会考虑将规范化作为第一步，因此城市、县、州、国家作为单独的列会更好...SQL 语言的强大功能，再加上今天的 DBMS-es，允许您稍后在需要查看时对数据进行分组从其他一些非标准化的角度来看。

当系统正在开发时，如果您认为某些部分是一种改进，您可能会考虑“非标准化”。

回复收藏 0 原文

末蓝 2024-07-13 05:06:36

我认为在这种情况下平衡是合理的。如果将一列放入表中有意义，则将其放入表中，如果没有意义，则不要放入。您同事的方法肯定有助于规范化数据库，但如果您必须将 50 个表连接在一起才能获取所需的信息，那么这可能不是很有用。

我想我的答案是，用你最好的判断。

回复收藏 0 原文

如日中天 2024-07-13 05:06:36

唔。

我认为这是一种洗涤，取决于您特定的设计模型。绝对将具有多个字段的实体分解到自己的表中，或者其构成可能会随着应用程序的需求变化而改变的实体（例如 - 我无论如何都会分解地址，因为它有很多字段，但我如果您认为有可能需要处理外国地址（可以采用不同的形式（与电话号码相同）），那么尤其会这样做。

也就是说，当你让它工作时，请留意性能。如果您分离出一个需要进行大型且昂贵的连接的实体，那么将该表旋转回原始表可能会成为更好的设计决策。

回复收藏 0 原文

岛歌少女 2024-07-13 05:06:36

这有很多方面，但从应用程序效率的角度来看，更多的表有时会更高效。如果您有几个表，其中有一堆列，每次数据库执行操作时它都有机会进行锁定，则在锁定期间更多数据将不可用。如果锁升级到页和表（希望不是表:)），您可以看到这会如何减慢系统速度。

回复收藏 0 原文

轻许诺言 2024-07-13 05:06:36

使用尽可能少的列进行查询有巨大的好处。但表本身可以有很大的数字。 Jeff 对此也说了一些话。

基本上，请确保在执行查询时请求的数据不会超出您的需要 - 查询的性能与您请求的列数直接相关。

回复收藏 0 原文

笨死的猪 2024-07-13 05:06:36

我认为在做出决定之前，您必须查看所存储的数据类型。拥有地址表固然很棒，但前提是多人共享同一地址的可能性很高。如果每个人都有不同的地址，则将该数据保存在不同的表中只会引入不必要的联接。

我不认为拥有城市表有什么好处，除非城市本身就是您在应用程序中关心的实体。或者，如果您想限制用户可用的城市数量。

最重要的是，在开始提高效率之前，此类决策必须考虑应用程序本身。国际海事组织。

回复收藏 0 原文

恰似旧人归 2024-07-13 05:06:36

首先，标准化你的表格。这可确保您避免冗余数据，减少需要扫描的数据行，从而改进查询。然后，如果您遇到要连接的规范化表导致查询需要很长时间来处理（昂贵的连接子句）的情况，请在更合适的地方进行非规范化。

回复收藏 0 原文

天邊彩虹 2024-07-13 05:06:36

很高兴看到这么多鼓舞人心且有基础的答案。

我的答案是（不幸的是）：这要看情况。

两种情况：
* 如果您创建一个要使用多年的数据模型，因此可能必须适应许多未来的更改：选择更多的表和更少的行以及相当严格的标准化。
* 在其他情况下，您可以在更多表-更少行或更少表-更多行之间进行选择。特别是对于该主题相对较新的人来说，最后一种方法可以更加直观且易于理解。

这对于在面向对象方法和其他选项之间进行选择也是有效的。

回复收藏 0 原文

简美 2024-07-13 05:06:36

在设计数据库时，我遵循一些相当简单的经验规则，我认为这些规则可以用来帮助做出这样的决策......

支持标准化。非规范化是一种优化形式，需要进行所有必要的权衡，因此应该使用 YAGNI 来实现态度。
确保引用数据库的客户端代码与模式充分解耦，从而无需对客户端进行重大重新设计。
当非规范化对性能或查询复杂性有明显的好处时，不要害怕它。
当数据量和使用场景允许时，使用视图或下游表来实现反规范化，而不是对架构的核心进行反规范化。

这些规则的通常结果是，初始设计将倾向于表而不是列，重点是消除冗余。随着项目的进展和非规范化点的确定，整体结构将朝着一种平衡发展，以有限的冗余和列扩散来妥协，以换取其他有价值的好处。

回复收藏 0 原文

如痴如狂 2024-07-13 05:06:36

我赞成增加桌子，但仅限于一定程度。以您的示例为例，如果您将用户信息分成两个表，例如“USERS”和“ADDRESS”，那么您可以灵活地为每个用户拥有多个地址。一个明显的应用是具有单独的帐单地址和送货地址的用户。

支持使用单独的 CITY 表的论点是，您只需将每个城市的名称存储一次，然后在需要时引用它。这确实减少了重复，但在这个例子中我认为这是多余的。它可能更节省空间，但是当您从数据库中选择数据时，您将付出联接的代价。

回复收藏 0 原文

独闯女儿国 2024-07-13 05:06:36

这听起来不太像关于表/列的问题，而是关于规范化的问题。在某些情况下，具有高度的规范化（本例中为“更多表”）很好，也很干净，但通常需要大量 JOIN 才能获得相关结果。如果数据集足够大，这可能会降低性能。

Jeff 写了一些关于 StackOverflow 设计的内容。另请参阅 Dare Obasanjo 链接到的 Jeff 帖子。

回复收藏 0 原文

っ左 2024-07-13 05:06:36

每个表应该只包含属于由主键唯一标识的实体的列。如果数据库中的所有列都是同一实体的属性，那么您只需要一张包含所有列的表。

但是，如果任何列可能为空，则需要将每个可为空的列放入其自己的表中，并使用主表的外键来对其进行规范化。这是一种常见的情况，因此为了更简洁的设计，您可能会向现有表添加比列更多的表。此外，通过将这些可选属性添加到它们自己的表中，它们将不再需要允许空值，并且您可以避免大量与 NULL 相关的问题。

回复收藏 0 原文

山川志 2024-07-13 05:06:36

完全规范化的设计（即“更多表”）更加灵活，更易于维护，并且可以避免数据重复，这意味着您的数据完整性将更容易执行。

这些都是实现正常化的有力理由。我会选择首先标准化，然后仅在您发现性能成为问题后对特定表进行反规范化。。

我的经验是，在现实世界中，即使数据集非常大，您也不会达到需要非规范化的程度。

回复收藏 0 原文

温柔戏命师 2024-07-13 05:06:36

这取决于您的数据库风格。例如，MS SQL Server 往往更喜欢较窄的表。这也是更“标准化”的方法。其他引擎可能更喜欢相反的方式。大型机往往属于这一类。

回复收藏 0 原文

浅浅 2024-07-13 05:06:36

就像其他一切一样：这取决于情况。

关于列数与表数没有硬性规定。

如果您的客户需要拥有多个地址，那么为此建立一个单独的表是有意义的。如果您有充分的理由将“城市”列标准化为自己的表，那么也可以这样做，但我以前没有见过这种情况，因为它是一个自由格式字段（通常）。

桌子沉重的标准化设计在空间方面是高效的，看起来“教科书般的好”，但可能会变得极其复杂。看起来不错，直到您必须执行 12 次连接才能获取客户的姓名和地址。这些设计在最重要的性能（查询）方面并不是自动表现出色。

如果可能的话，避免复杂性。例如，如果客户只能有两个地址（不是任意多个），那么将它们全部保存在一个表中可能是有意义的（CustomerID、Name、ShipToAddress、BillingAddress、ShipToCity、BillingCity 等）。

这是 Jeff 关于该主题的帖子。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

尘世孤行

文章 0 评论 0

烟─花易冷

文章 0 评论 0

你是年少的欢喜

文章 0 评论 0

倒带

文章 0 评论 0

忱杏

文章 0 评论 0

送君千里

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文