PHP 函数 iconv 字符编码从 iso-8859-1 到 utf-8
我正在尝试将字符串从 iso-8859-1 转换为 utf-8。 但是当我找到这两个字符 € 和 • 时,函数返回 一个字符,是一个里面有两个数字的正方形。
我该如何解决这个问题?
I'm trying to convert a string from iso-8859-1 to utf-8.
But when I find these two charachter € and • the function returns
a charachter that is a square with two number inside.
How can I solve this issue?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
我认为您正在寻找的编码是 Windows 代码页 1252 (西欧)。它与 ISO-8859-1(或 8859-15)不同; 0xA0-0xFF 范围内的字符与 8859-1 匹配,但 cp1252 在 0x80-0x9F 范围内添加了一系列额外字符,其中 ISO-8859-1 分配很少使用的控制代码。
之所以会出现这种混乱,是因为当您将页面提供为
text/html;charset=iso-8859-1
时,由于历史原因,浏览器实际上使用 cp1252(因此会提交cp1252 中也有形式)。I think the encoding you are looking for is Windows code page 1252 (Western European). It is not the same as ISO-8859-1 (or 8859-15 for that matter); the characters in the range 0xA0-0xFF match 8859-1, but cp1252 adds an assortment of extra characters in the range 0x80-0x9F where ISO-8859-1 assigns little-used control codes.
The confusion comes about because when you serve a page as
text/html;charset=iso-8859-1
, for historical reasons, browsers actually use cp1252 (and will hence submit forms in cp1252 too).请务必先检查您的编码!你永远不应该盲目相信你的编码(即使它来自你自己的网站!):
Always check your encoding first! You should never blindly trust your encoding (even if it is from your own website!):
iso-8859-1 不包含 € 符号,因此如果您的字符串包含它,则无法使用 iso-8859-1 进行解释。请改用 iso-8859-15。
iso-8859-1 doesn't contain the € sign so your string cannot be interpreted with iso-8859-1 if it contains it. Use iso-8859-15 instead.
这 2 个字符在 iso-8859-1 中是非法的(您是指 iso-8859-15 吗?)
Those 2 characters are illegal in iso-8859-1 (did you mean iso-8859-15?)