通常，字符串（或 varchar）字段用作连接字段吗？

发布于 2024-09-27 07:13:23 字数 144 浏览 6 评论 0原文

我们有两张桌子。第一个包含名称 (varchar) 字段。第二个包含一个引用第一个表中的名称字段的字段。第二个表中的外键将针对与该名称关联的每一行重复。通常不鼓励使用 varchar/string 字段作为两个表之间的联接吗？什么时候是字符串字段可以用作连接字段的最佳情况？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

最舍不得你 2024-10-04 07:13:23

当然可以使用 varchar 作为关键字段（或者只是要加入的字段）。它的主要问题取决于您通常在 varchar 字段中存储的内容；可变数据。严格来说，不建议更改关键字段。一个人的姓名、电话号码、甚至社会安全号（SSN）都可能发生变化。但是，内部 ID 为 3 的员工将始终为 ID 3，即使有两个 John Smith。

其次，字符串比较取决于许多挑剔的细节，例如区域性、排序规则、空格转换等，这些细节可能会在没有明显原因的情况下破坏连接。假设您对要加入的某个字符串使用制表符 \t。稍后，您更改软件以将 \t 替换为 3 个空格，以减少原始字符串中的字符转义。您现在已经破坏了任何需要将带有转义制表符的字符串与外观相同但组成不同的字符串相匹配的功能。

最后，即使给定两个完全相同的字符串，比较两个整数比比较两个字符串也有轻微的性能优势。整数比较实际上是恒定时间的。字符串比较最多是线性的，基于字符串的长度。

回复收藏 0 原文

彼岸花似海 2024-10-04 07:13:23

通常不鼓励使用 varchar/string 字段作为两个表之间的联接吗？

如果需要使用自然键（在现实生活中极其罕见，但州/省缩写就是一个很好的例子），那么 VARCHAR 字段就可以了。

什么时候字符串字段可以用作连接字段的最佳情况？

取决于数据库，因为分配给数据类型的位，但通常 VARCHAR(4) 或更少占用与 INT 相同的空间量（字符数越少）。

回复收藏 0 原文

萌酱 2024-10-04 07:13:23

一般来说，您不应该使用最终用户可编辑的任何内容作为 FK，因为编辑不需要一次更新，而是每个引用该键的表一次更新。

其他人已经提到了查询的潜在性能影响，但更新成本也值得注意。我强烈建议使用生成的密钥。

回复收藏 0 原文

风筝有风，海豚有海 2024-10-04 07:13:23

如果您担心性能，最好的了解方法是创建实现您潜在设计选择的表，然后向它们加载大量数据以查看会发生什么。

理论上，非常小的字符串在连接中的性能应该与数字一样好。实际上，这肯定取决于数据库、索引和其他实现选择。

回复收藏 0 原文

静水深流 2024-10-04 07:13:23

在关系数据库中，不应在一个表中使用引用另一表中相同字符串的字符串。如果第二个表是查找表，请为该表创建一个标识列，然后引用第一个表中的整数值。显示数据时，使用第二个表的联接。只需确保在第二个表中您从未真正删除记录。

唯一的例外是，如果您要创建一个存档表，您希望在其中准确存储给定时间选择的内容。

回复收藏 0 原文

桃扇骨 2024-10-04 07:13:23

有时，联接会发生在非“联接字段”的字段上，因为这就是查询的本质（例如，识别特定列中重复记录的大多数方法）。如果您想要的查询与这些值相关，那么这就是连接所在的位置，故事结束。

如果一个字段确实标识了一行，那么就可以将其用作键。如果它可以改变（它会带来问题，但不是不可克服的问题），只要它仍然是一个真正的标识符（它永远不会更改为另一行中存在的值），甚至可以这样做。

性能影响因常见查询和数据库而异。通过数据库，某些数据库的索引策略类型使它们比其他数据库更擅长使用 varchar 和其他文本键（特别是散列索引很好）。

即使没有哈希索引，常见查询也可以使用 varchar 来提高性能。一个典型的例子是为多语言网站存储文本片段。每一段这样的文本都会有一个与它所使用的语言相关的特定语言ID。但是，很少需要获取有关该语言的其他信息（它的名称等）；更经常需要的是通过 RFC 5646 代码进行过滤，或者找出 RFC 6546 代码是什么。如果我们使用数字 ID，那么我们将必须连接两种类型的查询才能获取该代码。如果我们使用代码作为 ID，那么与该语言相关的最常见查询根本不需要查看语言表。大多数关心语言细节的查询也不需要进行任何连接；几乎唯一一次将键用作外键是在更新和插入文本或删除语言时维护引用完整性。因此，虽然在使用连接时效率较低，但通过使用较少的连接，整个系统将更加高效。

回复收藏 0 原文