如何修复unicode字母？

发布于 2024-12-10 03:36:24 字数 241 浏览 3 评论 0原文

有人在电子邮件中向我发送了这样的信件

IVIàRâ€â€™

正确应该是

IVIØR†€™

假设是我如何用原始葡萄牙语表示它们，它在通过 HTTP GET 请求传递后发生了变化。

我可能无法修复该网站..但也许创建一个修复工具来修复这些损坏的编码字母？或者有人知道有什么修复工具吗？或者如何手动完成？似乎没有什么损失..只是解释得很糟糕

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

故乡的云 2024-12-17 03:36:24

这里发生的事情是 UTF-8 被误解为 ISO-8859-1；然后其他类型的损坏（错误的 ISO-8859-1 字符串被重新编码为 UTF-8；不间断空格字符 '\xA0' 被转换为常规空格 '\x20'）似乎随后发生了，尽管这些可能只是将其粘贴到 Stack Overflow 中的结果。

由于随后的损坏，没有真正好的方法可以完全撤消它，但是您可以通过不太严格的 UTF-8 解释器传递它很大程度上来撤消它。例如，如果我使用记事本将“IVIàR”作为文本文件保存在计算机上，使用“ANSI”（单字节）编码，然后在 Firefox 中打开它并告诉它将其解释为 UTF-8（Firefox > Web Developer > 字符编码 > Unicode (UTF-8)），然后显示“IVIØR� €™”。（“�”是因为“\xA0”已更改为“\x20”，这破坏了 UTF-8 编码。）

回复收藏 0 原文