Unicode - 术语表 编辑

Unicode 是一种字符集标准,用于对来自世界上不同语言、文字系统和符号进行编号和字符定义。通过给每个字符分配一个编号,程序员可以创建字符编码,让计算机在同一个文件或程序中存储、处理和传输任何语言组合。

在 Unicode 定义之前,在同一数据中混合使用不同的语言是很困难的,而且容易出错。例如,一个字符集存储的是日文字符,而另一个字符集存储的是阿拉伯字母。如果没有明确标明数据的哪些部分属于哪个字符集,其他程序和计算机就会错误地显示文本,或者在处理过程中损坏文本。如果你曾经见过像 (“”) 被替换为胡言乱语 Ã‚£,那么你就已经看到过这个被称为  Mojibake 的问题。

网络上最常见的 Unicode 字符编码是UTF-8。还存在一些其他编码,如 UTF-16或过时的 UCS-2,但推荐使用 UTF-8。

了解更多

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

词条统计

浏览:81 次

字数:1603

最后编辑:7年前

编辑次数:0 次

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文