当前位置：文江博客话题详情

在 SQL Server 中存储 UTF-16/Unicode 数据

发布于 2024-07-18 10:57:37 字数 462 浏览 21 评论 0原文

根据此，SQL Server 2K5在内部使用UCS-2 。它可以在 UCS-2 中存储 UTF-16 数据（具有适当的数据类型，nchar 等），但是如果有补充字符，则会存储为 2 个 UCS-2 字符。

这给字符串函数带来了一个明显的问题，即 SQL Server 将 1 个字符视为 2 个字符。

让我有些惊讶的是，SQL Server 基本上只能处理 UCS-2，更令人惊讶的是，这在 SQL 2K8 中并未得到修复。我确实意识到其中一些角色可能并不那么常见。

除了本文中建议的函数之外，还有有关在 SQL Server 2K5 中处理（损坏的）字符串函数和 UTF-16 数据的最佳方法的任何建议。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小姐丶请自重 2024-07-25 10:57:37

SQL Server 2012 现在支持 UTF-16，包括代理项对。请参阅 http://msdn.microsoft.com/en -us/library/ms143726(v=sql.110).aspx，尤其是“补充字符”部分。

因此，解决最初问题的一种方法是采用 SQL Server 2012。

回复收藏 0 原文

鹊巢 2024-07-25 10:57:37

字符串函数可以很好地处理 unicode 字符串；关心字符数的人将两字节字符视为单个字符，而不是两个字符。唯一需要注意的是 len() 和 datalength()，它们在使用 unicode 时返回不同的值。当然，它们返回正确的值 - len() 返回以字符为单位的长度，而 datalength() 返回以字节为单位的长度。它们只是由于两字节字符而恰好不同。

因此，只要您在代码中使用正确的函数，一切都应该透明地工作。

编辑：只需仔细检查在线图书，自 SQL Server 2000 以来，unicode 数据就可以与字符串函数完美配合。

编辑 2：正如评论中指出的，SQL Server 的字符串函数不支持完整的 Unicode 字符集，因为缺乏对解析平面 0 之外的代理（或者，换句话说，SQL Server 的字符串函数只能识别每个字符最多 2 个字节。）SQL Server 将正确存储和返回数据，但是任何依赖于字符计数的字符串函数都不会返回预期值。绕过此问题的最常见方法似乎是在 SQL Server 外部处理字符串，或者使用 CLR 集成添加 Unicode 感知字符串处理函数。

回复收藏 0 原文