当前位置：文江博客话题详情

VARCHAR 完全像 20 世纪 90 年代吗？

发布于 2024-07-09 10:55:33 字数 304 浏览 7 评论 0原文

VARCHAR 不存储 Unicode 字符。
NVARCHAR 确实存储 Unicode 字符。
当今的应用程序应该始终与 Unicode 兼容。
NVARCHAR 需要两倍的空间来存储它。
第 4 点并不重要，因为存储空间非常便宜。

因此：当今设计 SQL Server 数据库时，应始终使用 NVARCHAR。

这是合理的推理吗？有人不同意其中的任何前提吗？现在有什么理由选择 VARCHAR 而不是 NVARCHAR？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

め可乐爱微笑 2024-07-16 10:55:33

您将数据类型与将存储在列中的数据相匹配。通过类似的论点，您可能会说为什么不将所有数据存储在 NVARCHAR 列中，因为数字和日期可以表示为数字字符串。

如果将存储在列中的数据的最佳匹配是 VARCHAR，则使用它。

回复收藏 0 原文

回眸一笑 2024-07-16 10:55:33

第 4 点并不重要，因为存储空间非常便宜。

它不仅仅是存储，还有带宽——CPU、内存、备份、恢复、传输。养护。

回复收藏 0 原文

长途伴 2024-07-16 10:55:33

我想说，不使用 nvarchar 仍然有充分的理由。

存储空间非常宝贵，例如在共享主机上或数据库上
真的巨大。
性能至关重要。
棕地开发（即数据库具有使用 varchar 的现有表）。
您正在与另一个仅理解单字节字符和/或 varchar 的旧系统集成。

然而，新的开发可能应该使用 nvarchar esp。因为 64 位系统正在成为常态。此外，公司（甚至是小公司）现在更加全球化。

回复收藏 0 原文

秋意浓 2024-07-16 10:55:33

对于许多不同类型的列，您应该选择 VARCHAR 而不是 NVARCHAR，并且选择将基于每列。

不需要 NVARCHAR 产生额外开销的典型列有：

ID 类型列：车牌、SSN、患者图表标识符等。

代码列：国际货币代码（USD、UKP 等）、ISO 国家/地区代码（美国、 UK 等）、语言代码（en-us 等）、会计段代码等

邮政编码和邮政编码列。

回复收藏 0 原文

靖瑶 2024-07-16 10:55:33

我相信 nvarchar 的比较比 varchar 的成本更高，因此它完全有效，甚至在您确实不需要 unicode 功能的地方（即对于某些内部 ID）来说是首选。

存储成本仍然很重要。如果您有数十亿行，那么这些“小”差异很快就会变得很大。

回复收藏 0 原文

芯好空 2024-07-16 10:55:33

正如其他人指出的那样，这不仅仅是存储成本。

列的长度将影响每页的行数。每页的行数越少意味着可以放入缓存的行数就越少，从而降低性能。我假设在 MSSQL 中，索引的 NVARCHAR 列将占用索引中的更多空间。这意味着每个块的索引条目更少，因此索引中的块更多，因此在扫描（或搜索）索引时进行更多的查找，这也会减慢索引访问的速度。

所以它会降低你在各个方面的表现。如果您真的不关心（或者当然可以衡量性能并对此感到满意），那也没关系。但如果您确实需要存储 unicode 字符，当然可以使用 NVARCHAR。

我认为在整个数据库中使用 NVARCHAR 所获得的可维护性可能超过任何性能成本。

回复收藏 0 原文

旧伤慢歌 2024-07-16 10:55:33

这类问题总是有相同的答案：这取决于。没有什么神奇的规则是你应该盲目遵循的。即使在现代编程语言中使用 GOTO 也是合理的：在支持循环的语言中使用“goto”是否有利和功能？如果是这样，为什么？

所以答案是：用你的头脑思考特定的情况。在这个特定实例中，请记住，如果您的需求发生变化，您始终可以在数据库中从 varchar 转换为 nvarchar。

回复收藏 0 原文

兮颜 2024-07-16 10:55:33

我看到 nvarchar 列转换为 varchar 有两个原因：

应用程序正在使用 MSSQL Express
版本，数据库大小为 4GB
限制。切换到 MSSQL 标准
如果版本太贵了
有很多数据库部署，
就像单租户 Web 应用程序一样
或具有嵌入式 DBMS 的应用程序。
更便宜的SQL2008网络版
可以在这里提供帮助。
nvarchar(4000) 不够但是你
不想要 ntext 列。那么你
转换为 varchar(8000)。然而，
在大多数情况下，您可能应该转换为 nvarchar(max)。

回复收藏 0 原文

蝶舞 2024-07-16 10:55:33

你的第3点无效。专为单个国家/地区使用而设计的系统不必担心 unicode，并且正在使用的某些语言/产品根本不支持或仅部分支持 unicode。例如，TurboTax 仅适用于美国（即使有法语的加拿大版本，仍然只是 LATIN-1），所以他们不需要或不必担心 unicode 并且可能不支持它（我不知道他们是否支持，但即使他们支持，这只是一个例子）。

“今天的应用程序应该始终与 Unicode 兼容。”

可能更有效的表述是：

“如果没有什么特殊需要来正确处理 Unicode，那么今天的应用程序应该始终与 Unicode 兼容，并且以前存在的代码库或应用程序的任何其他部分不需要专门更新来支持它”

回复收藏 0 原文

执笏见 2024-07-16 10:55:33

存储比以往任何时候都便宜，但如果您可以在给定的硬盘驱动器上存储两倍的数据，这仍然很有吸引力，不是吗？

还有用于缓存的 RAM 和固态硬盘，它们都比硬盘贵得多。当您有数百万行时，使用更紧凑的数据格式是有益的。

回复收藏 0 原文

岁月如刀 2024-07-16 10:55:33

有没有办法让您的数据库服务器使用 UTF-8 作为编码？然后，您可以获得大部分 ASCII 负载的低存储空间的优势，以及存储 Unicode 范围内的任何内容的能力，以便可以进行扩展。

我会要求您的数据库供应商也支持 UTF-8 作为 VARCHAR SQL 类型的编码。我不知道其他数据库服务器是如何做到这一点的，但我知道至少可以在 MySQL 和 PostgreSQL 中的 VARCHAR 和 TEXT 字段中使用 UTF-8。

尽管如此，不使用 UTF-16 编码字段的唯一原因是，如果您必须与在 UTF-16 输入时会中断的应用程序进行交互。这将是大多数设计用于处理 ASCII 或 ISO-8815 文本编码的遗留应用程序，处理 UTF-8 会更好。

回复收藏 0 原文

月下客 2024-07-16 10:55:33

我的倾向是“使用 NVARCHAR”作为默认值...但 @CadeRoux 有一个很好的观点：如果您确定数据永远不会包含除 ASCII 之外的任何内容 - 就像美国车牌 - VARCHAR 可能会为您节省一点点成本。

我想说的是，他精心表述的另一面是“对于任何有名称（人、街道、地点）或自然语言文本（电子邮件、聊天、文章、博客帖子、照片标题）的东西，请使用 NVARCHAR”。否则，您的“名字”列将无法正确编码“François”或“José”，并且您的文本列将不允许带有“外国”变音符号的文本，或者 - 就此而言 - 非常常见的美国字符，例如分号“¢”、段落标记“¶”、项目符号“•”。（因为这些都不是 ASCII 字符，并且没有好的、标准的方法将它们放入 VARCHAR 字段。相信我：你会伤害自己。）

在我工作过的任何项目中继续，我从来没有因为使用 NVARCHAR 而被责骂，因为我“在磁盘空间上浪费了太多公司的钱”。如果我必须重新编写代码或数据库模式（尤其是在实时生产系统上），则重新安装所花费的成本将轻松超过购买缩小 50% 的磁盘所“节省的成本”。

要真正理解这个问题，您必须了解 ASCII、Unicode 和 Unicode 的典型编码（例如 UCS-2 和 UTF-8）。

回复收藏 0 原文