使用 mechanize 和 Python 2.6 下载 HTML 的编码问题
browser = mechanize.Browser()
page = browser.open(url)
html = page.get_data()
print html
它显示了一些奇怪的字符。我认为它是 UTF-8 字符串,但 Python 不知道这一点并且无法正确显示它。
如何将此字符串转换为 unicode 字符串,例如
u = u'test'
browser = mechanize.Browser()
page = browser.open(url)
html = page.get_data()
print html
It shows some strange characters. I suppose that it is UTF-8 string but Python doesn't know that and cannot show it properly.
How can I convert this string to unicode string like
u = u'test'
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
它被压缩了
It was gzipped
你需要定义编码
喜欢:
机械化需要它。
欲了解更多信息,请查看此
http://www.python.org/dev/peps/pep-0263/
you need to define the encoding
like :
mechanize need it .
for more information check this out
http://www.python.org/dev/peps/pep-0263/