当前位置：文江博客话题详情

代码页和编码

发布于 2024-07-08 10:52:57 字数 123 浏览 12 评论 0原文

在有人建议我对此进行谷歌搜索之前，我已经这样做了。我只需要更清楚地了解代码页和编码。

如果我使用 UTF8 编码，并使用意大利代码页，然后使用法国代码页，这是否意味着即使字节没有改变，我也会得到不同的字符？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

顾铮苏瑾 2024-07-15 10:52:58

乔尔对此有一个很好的总结：
http://www.joelonsoftware.com/articles/Unicode.html

不。如果我正确理解你的问题，那并不意味着。
当您将 UTF-8 转换为特定代码页时，可能只有部分字符会被转换。那些没有被转换的会发生什么取决于你如何调用转换。可能的结果是无法映射到代码页的字符将被转换为问号字符。

回复收藏 0 原文

昔梦 2024-07-15 10:52:58

编码只是数值和“字符”之间的映射。

US-ASCII 将数字 65 映射到字母 A，将 32 映射到空格，将 49 映射到数字“1”。（这些东西如何呈现是另一回事。）事实上，UTF-8 也是这样做的！但 UTF-8 对其他值的处理方式与 ASCII 不同。它是一种变长编码，即一个字符可以用1、2、3或4个字节进行编码；普通字符通常消耗较少的字节。

纯文本文件（包括网页）作为字节序列存储和传输。这些字节应该代表一些文本。软件应用程序（如文本编辑器和网络浏览器）负责在屏幕上呈现这些文件中的信息。通常他们使用库或操作系统函数。

如果软件采用与创建文件的软件不同的编码，则可能会显示错误的字符！

请注意，不同编码之间可以进行转换；但是，如果您转换为不包含特定字符的编码，则软件必须选择使用什么字符。这种转换通常是透明地发生的（当您使用某种编码保存文件时，您输入的任何内容都必须更改为该编码）。

回复收藏 0 原文