当前位置：文江博客话题详情

每个表中都有地址列，或者有一个被其他表引用的地址表？

发布于 2024-09-10 04:38:39 字数 60 浏览 12 评论 0原文

假设我有三张表：住宿、火车站和机场。每个表中是否都有地址列或其他表引用的地址表？是否存在过度正常化的情况？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

白首有我共你 2024-09-17 04:38:40

如果您使用的是 Oracle 9i，则可以在表中存储地址对象。这将消除对地址格式的（合理的）担忧。

回复收藏 0 原文

简单爱 2024-09-17 04:38:40

我同意 S.Lott 的观点，并想补充一点：

一个好的答案取决于您已经知道的内容。然而，关系数据库理论的基本“数学”定义了非常明确的、不同的标准化级别。当你达到终极正常形态时，你就无法再正常化了。
根据您想要用三个实体建模的内容以及识别它们的方式，您可以想出非常不同的概念数据模型，所有这些模型都可以用规范形式的混合来表示 - 或者根本不规范化（就像 1 个表，用于存储所有带有描述符的数据，并且到处都是 NULL 孔...）。
考虑将三个实体规范化为最终规范形式。我现在可以引入一个新的需求、用例或扩展，如果您查看其内容，它会为当前的描述性属性提供某种有序的、引用的或结构化的性质。然后，模型应该表示这种行为，而以前的属性也许最好是由其他实体引用的单独实体。
过度标准化？只有在某种意义上，您才能标准化给定的模型，从而使其在给定的数据库平台上存储或处理效率低下。根据在那里可以有效处理的内容，您可能希望对某些方面进行非规范化，以冗余换取速度（数据仓库数据库一直这样做）和洞察力，反之亦然。？

到目前为止，我见过的所有（工作）数据库设计要么具有相当规范化的概念数据模型，要么在逻辑和/或物理数据模型级别（用 Sybase PowerDesigner 术语来说）完成了相当多的非规范化，以使模型“易于管理” ——要么是这样，要么它们无法工作，即失败，因为维护问题很快就变得非常严重。

回复收藏 0 原文

唐婉 2024-09-17 04:38:40

当您说“地址”时，我认为您指的是完整的地址，例如街道、城市、州/省，也许是国家/地区和邮政编码。这是 4 或 5 个字段，如果您允许“地址行 1”和“地址行 2”、转交等，可能会更多。这肯定应该在一个单独的表中，并有一个“addressid”链接到站，等表。否则，您将创建同一组字段定义的 3 个单独副本。这是个坏消息，因为它需要额外的努力来保持它们的一致性。例如，如果最初您只处理美国地址（我是美国人，所以我假设是美国），但后来您发现您还需要允许加拿大人，该怎么办？您需要扩大邮政编码字段的大小并添加国家/地区代码。如果有一个公用表，那么您只需执行一次。如果没有，那么你必须这样做三遍。而且“三次”很可能不仅仅是更改数据库架构，而是更改程序中处理地址的每个位置。

标准化的好处之一是最大限度地减少变化的影响。

回复收藏 0 原文

墟烟 2024-09-17 04:38:40

有时您想要非规范化以使查询更高效。但只有在您有充分的理由相信完全标准化的模型会造成严重的低效率问题之后，才应该非常谨慎地进行此操作。根据我的卑微经验，大多数程序员都太快地进行非规范化，通常会快速“哦，将其分解到一个单独的表中太麻烦了”。

回复收藏 0 原文

演多会厌 2024-09-17 04:38:40

我认为在这种情况下，每个表中都有地址列是可以的。您几乎不会有一个地址会被使用两次以上。大多数地址每个实体仅使用一个。

但是额外的表中可能包含街道、城市、国家的名称……

最重要的是，每个火车站、住宿和机场可能只有一个地址，因此这是一种 n:1 关系。

回复收藏 0 原文

熊抱啵儿 2024-09-17 04:38:40

我只能对此处已发布的答案添加一个更具建设性的注释。无论您选择如何标准化数据库，当地址标准化（看起来相同）时，这个过程就变得几乎微不足道。这是因为当您努力防止重复时，所有实际上相同的地址看起来确实相同。

现在，标准化地址并非易事。有一些 CASS 服务可以为您执行此操作（针对美国地址），并且这些服务已获得 USPS 的认证。实际上，我在 SmartyStreets 工作，这是我们的专业知识，所以我建议您从那里开始搜索。您可以执行批处理或使用 API 在收到地址时对其进行标准化。

如果没有这样的东西，您的数据库可能会标准化，但重复的地址数据（无论是正确的还是不完整的和无效的等）仍然会渗透进来，因为它们可以采用很多很多的形式。如果您对此还有任何疑问，我将亲自为您提供帮助。

回复收藏 0 原文

薆情海 2024-09-17 04:38:39

数据库规范化就是构建维护某些功能的关系（表）
关系（表）内的事实（列）之间以及各种关系（表）之间的依赖关系
组成架构（数据库）。有点满嘴，但这就是它的全部内容。

五个简单指南关系数据库理论中的范式
是范式的经典参考。本文简单地定义了每种范式的本质是什么
及其对于数据库表设计的意义。这是一个非常好的“试金石”参考。

要正确回答您的具体问题，需要额外的信息。您必须提出的一些关键问题
是：

地址是简单事实（例如文本块）还是复合事实（例如
由多个属性组成：地址行、城市名称、邮政编码等）
与“住宿”相关的其他“事实”是什么，
“机场”和“火车站”？
哪些“事实”可以唯一且最低限度地识别“机场”、“住宿”
和“火车站”（这些事实通常称为密钥或候选密钥）？
地址事实和事实之间存在哪些功能依赖性
组成每个关系键？

综上所述，您问题的答案并不像人们希望的那样直接！

是否存在“过度正常化”的情况？或许。这取决于是否
您已识别并用于构建表的功能依赖性是
对您的应用领域具有重要意义。

例如，假设确定地址
由多个属性组成；其中之一是邮政编码。从技术上讲是邮政
代码也是一个复合项目（至少加拿大邮政编码是）。进一步规范化你的
数据库来识别这些事实可能会过度标准化。这是因为
邮政编码的组成部分与您的申请无关，因此需要考虑
将它们纳入数据库设计将是过度规范化。

回复收藏 0 原文

淡淡的优雅 2024-09-17 04:38:39

对于地址，我几乎总是创建一个单独的地址表。不仅为了标准化，而且为了存储字段的一致性。

至于过度正常化这种事情，绝对是有的！很难给你关于什么是过度正常化、什么不是过度正常化的指导，因为我认为这主要来自经验。然而，如果按照规范化各个级别的书籍进行操作，那么一旦开始变得难以看出事情的具体情况，您可能就走得太远了。

也可以查看所有示例/示例数据库。它们会给您一个很好的指示，告诉您何时应该分割数据，何时不应该分割数据。

另外，请充分了解您存储的数据的类型和数量，以及访问速度等。出于许多性能和可扩展性的原因，许多现代 Web 软件正在完全非规范化。值得研究一下为什么以及何时应该和不应该去标准化的原因。

回复收藏 0 原文

无语# 2024-09-17 04:38:39

每个表中是否都有地址列或其他表引用的地址表？

机场、火车站和住宿可以有不同的地址格式吗？

单个地址表最大限度地减少了处理地址所需的工作 - 套件、RR、邮政编码、州/省...

是否存在过度标准化这样的事情？

标准化有不同的级别。我只遇到过我认为糟糕的设计而不是规范化。

回复收藏 0 原文

_蜘蛛 2024-09-17 04:38:39

就我个人而言，我会去另一张桌子。

我认为它使设计更加清晰，使地址报告更加简单，并使您需要对地址架构进行的任何更改变得更加容易。

如果您稍后需要对其进行非规范化，您始终可以创建两个视图，其中包含火车站和机场信息以及您需要的任何地址信息。

回复收藏 0 原文

终止放荡 2024-09-17 04:38:39

这并不是我所理解的标准化。您似乎没有谈论删除冗余，只是谈论如何对存储或数据模型进行分区。我假设住宿、火车站和机场的地址示例都是不相交的？

据我所知，只有当你开始按照思路思考时，这才会成为常态。邮政编码在功能上取决于街道地址，因此应将其分解到其自己的表中。

在这种情况下，根据上下文，这可能是理想的或不理想的。如果您管理记录并可以确保正确性，则可能是理想的选择；如果用户可以更新自己的记录，则不太理想。

一个相关的问题是标准化一个人的名字是否太过分了< /a>？

回复收藏 0 原文

小…红帽 2024-09-17 04:38:39

如果您有一个对性能非常敏感的项目/功能，那么在某些情况下对数据库进行非规范化可能是明智之举。然而，这可能会因各种原因导致维护问题。您可能想使用缓存表复制数据，但这也有缺点。这确实是根据具体情况而定，但在正常实践中，数据库规范化是一件好事。我见过的 99% 的非标准化数据库都不是设计使然，而是开发人员的误解/错误。

回复收藏 0 原文