SQL Server 规范化策略：varchar 与 int Identity

发布于 2024-07-06 02:43:57 字数 649 浏览 6 评论 0原文

我只是想知道这里的最佳解决方案是什么。

假设我有一个规范化的数据库。整个系统的主键是varchar。我想知道的是我应该将这个 varchar 与 int 关联起来以进行规范化还是保留它？保留为 varchar 更简单，但可能更优化

例如我可以

People
======================
name      varchar(10)   
DoB       DateTime    
Height    int  

Phone_Number
======================
name      varchar(10)   
number    varchar(15)

或者我当然可以

People
======================
id        int Identity   
name      varchar(10)   
DoB       DateTime  
Height    int  

Phone_Number
======================
id        int   
number    varchar(15)

添加其他几个一对多关系。

大家觉得怎么样？哪个更好？为什么？

原文

I'm just wondering what the optimal solution is here.

Say I have a normalized database. The primary key of the whole system is a varchar. What I'm wondering is should I relate this varchar to an int for normalization or leave it? It's simpler to leave as a varchar, but it might be more optimal

For instance I can have

People
======================
name      varchar(10)   
DoB       DateTime    
Height    int  

Phone_Number
======================
name      varchar(10)   
number    varchar(15)

Or I could have

People
======================
id        int Identity   
name      varchar(10)   
DoB       DateTime  
Height    int  

Phone_Number
======================
id        int   
number    varchar(15)

Add several other one-to-many relationships of course.

What do you all think? Which is better and why?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

或十年 2024-07-13 02:43:57

其他人似乎没有提到的一件事是 int 字段上的联接往往比 varchar 字段上的联接性能更好。

我肯定会始终使用代理键而不是使用（人或企业）名称，因为随着时间的推移，它们永远不会是唯一的。例如，在我们的数据库中，有 164 个名称，其中有 100 多个同名实例。这清楚地表明了考虑使用名称作为关键字段的危险。

回复收藏 0 原文

呢古 2024-07-13 02:43:57

最初的问题不是标准化问题。如果您有一个规范化的数据库，正如您所说，那么您不需要因为规范化原因而更改它。

你的问题确实有两个问题。第一个是 int 或 varchar 是否更适合用作主键和外键。第二个问题是是否可以使用问题定义中给出的自然键，或者是否应该生成合成键（代理键）来代替自然键。

int 比 varchar 更简洁，并且对于索引处理等事情更有效。但差异并不是压倒性的。您可能不应该仅根据此做出决定。

所提供的自然键是否真的可以作为自然键使用的问题更为重要。 “名称”列中的重复问题并不是唯一的问题。还有一个问题是当一个人改变名字时会发生什么。这个问题可能不会出现在您给出的示例中，但它确实会出现在许多其他数据库应用程序中。一个例子是学生四年内所修所有课程的成绩单。一个女人可能会在四年内结婚并改名，但现在你却陷入了困境。

您要么必须保持姓名不变，在这种情况下，它不再与现实世界相符，要么在该人参加的所有课程中追溯更新它，这使得数据库与当时打印的名册不一致。

如果您确实决定使用合成密钥，那么您现在必须决定应用程序是否要向用户社区透露合成密钥的值。这是另一堆蠕虫病毒，超出了本次讨论的范围。

回复收藏 0 原文

末が日狂欢 2024-07-13 02:43:57

如果“名称”字段确实适合作为主键，那么就这样做。在这种情况下，通过创建代理键，数据库将不会变得更加规范化。您将得到一些重复的外键字符串，但这不是规范化问题，因为 FK 约束保证字符串的完整性，就像代理键一样。

但是您没有解释“名称”是什么。在实践中，字符串适合作为主键的情况很少。如果是一个人的名字，就无法进行PK，因为多个人可以有相同的名字，人们可以更改名字等等。

回复收藏 0 原文

往事随风而去 2024-07-13 02:43:57

我认为如果您的 VARCHAR 更大，您会注意到您在整个数据库中复制了相当多的数据。然而，如果您使用数字 ID 列，则在将外键列添加到其他表时，您不会复制几乎相同数量的数据。

此外，文本数据在比较方面是一种巨大的痛苦，当你做 WHERE id = user_id 与 WHERE name LIKE inputname （或类似的事情）时，你的生活要容易得多）。

回复收藏 0 原文

花落人断肠 2024-07-13 02:43:57

你真的可以使用名称作为主键吗？几个人同名的话风险不是很高吗？

如果您真的很幸运，您的 name 属性可以用作主键，那么 - 无论如何 - 使用它。但通常情况下，您必须编写一些内容，例如 customer_id 等。

最后：“NAME”是至少一个 DBMS 中的保留字，因此请考虑使用其他内容，例如全名。

回复收藏 0 原文

柒七 2024-07-13 02:43:57

使用任何类型的非合成数据（即来自用户的任何数据，而不是由应用程序生成的数据）作为 PK 都是有问题的；您必须担心文化/本地化差异、区分大小写（以及取决于数据库排序规则的其他问题），如果/当用户输入的数据发生更改等时可能会导致数据问题。

使用非用户生成的数据（顺序 GUID）（或者非顺序，如果您的数据库不支持它们或者您不关心页面拆分）或身份整数（如果您不需要 GUID））则更容易且更安全。

关于重复数据：我不明白使用非合成密钥如何保护您免受重复数据的影响。您仍然遇到用户输入“Bob Smith”而不是“Bob K. Smith”或“Smith，Bob”或“bob smith”等的问题。无论您的密钥是否是合成的，重复管理都是必要的（并且几乎相同）或非合成密钥，非合成密钥具有合成密钥巧妙避免的许多其他潜在问题。

许多项目不需要担心这一点（例如，严格约束的排序规则选择避免了其中的许多排序规则），但总的来说，我更喜欢合成键。这并不是说你不能使用有机钥匙取得成功，显然你可以，但对于许多项目来说，它们并不是更好的选择。

回复收藏 0 原文