gb2312不是不能表示繁体中文吗?

发布于 2022-08-29 19:37:20 字数 316 浏览 6 评论 0

查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。

<html>
<head>
    <title></title>
    <meta charset="gb2312">
</head>
<body>
简体中文
繁體中文
</body>
</html>

运行上面代码的时候,发现繁體中文可以正常显示的,并不会乱码,哪里错了吗?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(5

煮茶煮酒煮时光 2022-09-05 19:37:20

在 Windows 上,GB2312 是 cp936 的别名,它是 GBK 或者 GB18030 我不太清楚了。

在其它平台,GB2312 还是真正的 GB2312,比如你在 Linux 上拿 Python 解析国内声明为 GB2312 的网页时一遇到生僻字或者繁体字就会报错了。

>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gb2312
�
 ��iconv: 未知 16 处的非法输入序列
>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gbk
�
 ��

前一命令在「體」字上转码出错了,后一命令成功执行。

攒一口袋星星 2022-09-05 19:37:20

GB 2312字符集并未包括繁体字,只有少数几个特例,这在维基百科GB 2312上有提到,所以如果严格按照GB 2312编码存储,会造成字符数据丢失。但是在Windows平台上当Locale是中国大陆时用非Unicode字符集进行汉字编码,默认会采用的是兼容GB 2312的GBK或GB 18030编码,这两个字符集都包含繁体字。

无声无音无过去 2022-09-05 19:37:20

摘自 Wiki GB 2312

GB 2312 或 GB 2312-80 是中华人民共和国国家标准 简体中文字符集

信仰 2022-09-05 19:37:20

不能。繁体应当是Big5.
你到浏览器里面看看,当前是什么字符集。

熟人话多 2022-09-05 19:37:20

GB2312 GB2312

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文