当前位置：文江博客话题详情

为什么我们需要 UCS 和 Unicode 字符集？

发布于 2024-12-26 13:06:29 字数 77 浏览 0 评论 0原文

我猜 UCS 和 Unicode 的代码点是相同的，对吗？

既然如此，为什么我们需要两个标准（UCS 和 Unicode）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

两相知 2025-01-02 13:06:29

它们不是两个标准。通用字符集 (UCS) 不是标准，而是标准中定义的内容，即 ISO 10646。这不应与编码（例如 UCS-2）混淆。

很难猜测您实际上是指不同的编码还是不同的标准。但对于后者，Unicode 和 ISO 10646 原本是两个不同的标准化工作，具有不同的目标和策略。然而，它们在 20 世纪 90 年代初进行了协调，以避免两种不同标准造成的混乱。它们已经过协调，因此代码点确实相同。

不过，它们保持不同，部分原因是 Unicode 是由一个可以灵活工作的行业联盟定义的，并且对标准化简单代码点分配之外的事物非常感兴趣。 Unicode标准定义了大量的原理和处理规则，而不仅仅是字符。 ISO 10646 是一个正式标准，可以在 ISO 及其成员的标准和其他文件中引用。

回复收藏 0 原文

烙印 2025-01-02 13:06:29

代码点相同，但存在一些差异。
来自有关 Unicode 和 ISO 10646（即 UCS）之间差异的维基百科条目：

它们之间的区别在于，Unicode 添加了 ISO 10646 范围之外的规则和规范。ISO 10646 是一个简单的字符映射表，是 ISO 8859 等先前标准的扩展。相反，Unicode 添加了排序规则、规范化规则表单，以及希伯来语和阿拉伯语等脚本的双向算法

您可能会发现阅读绝对最低限度每个软件开发人员绝对必须了解 Unicode 和字符集（没有借口！）

我认为差异来自于代码点的编码方式。 UCS-x 使用固定数量的字节来编码代码点。例如，UCS-2 使用两个字节。但是，UCS-2 无法对需要超过 2 个字节的代码点进行编码。另一方面，UTF 使用可变数量的字节进行编码。例如，UTF-8 至少使用一个字节（对于 ascii 字符），但如果字符超出 ascii 范围，则使用更多字节。

回复收藏 0 原文

~没有更多了~