Python 将 ISO 编码为 UTF8
我正在尝试使用 Python 脚本(Python 2.5 和 PyPy)阅读我的电子邮件 我的一些结果不是 ASCII 格式的,我得到的字符串如下:
=?ISO-8859-7?B?0OXm7/Dv8d/hIPP07+0gyuno4enx/u3h?='
有什么方法可以解码它并转换为 utf-8 以便我可以处理它? 我尝试了 .decode('ISO-8859-7') 但我得到了相同的字符串
I am trying to read my emails using a Python script (Python 2.5 and PyPy)
Some of my results are not in ASCII and i get strings like this:
=?ISO-8859-7?B?0OXm7/Dv8d/hIPP07+0gyuno4enx/u3h?='
Is there any way to decode it and convert to utf-8 so that i can process it?
I tried .decode('ISO-8859-7') but i got the same string
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您应该在这里使用 unicode_data 。但是,如果您(认为您)需要 UTF-8 编码的字符串,您可以:
更新:我更改了
.decode
调用以适应codec
为的情况>无
(例如eh.decode_header('plain text')
)You should work with unicode_data here. However, if you (think you) need UTF-8 encoded string, you can:
Update: I changed the
.decode
call to cater for cases where thecodec
isNone
(e.g.eh.decode_header('plain text')
)阅读 MIME 编码 和 Base64 编码。 base64 模块 将会很有用。
Read up on MIME encoding and Base64 encoding. The base64 module will be useful.