Python 将 Unicode-Hex utf-8 字符串转换为 Unicode 字符串
有 s = u'Gaga\xe2\x80\x99s'
但需要转换为 t = u'Gaga\u2019s'
如何最好地实现这一点?
Have s = u'Gaga\xe2\x80\x99s'
but need to convert to t = u'Gaga\u2019s'
How can this be best achieved?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
无论您在哪里解码原始字符串,它都可能是用 latin-1 或近亲解码的。由于 latin-1 是 Unicode 的前 256 个代码点,因此以下方法有效:
Where ever you decoded the original string, it was likely decoded with latin-1 or a close relative. Since latin-1 is the first 256 codepoints of Unicode, this works:
产量
yields
印刷
prints