python爬取网页时候遇到UnicodeDecodeError的错误
data = urllib.request.urlopen(url).read()
print(data)
data = data.decode('GBK')
print(data)
报错内容:Traceback (most recent call last):
File "C:UsersrootDesktopworker7worker.py", line 79, in <module>print(getvillageinfo(bbb[1248]))
File "C:UsersrootDesktopworker7worker.py", line 26, in getvillageinfo
data = data.decode('gbk')
UnicodeDecodeError: 'gbk' codec can't decode byte 0xfe in position 3169: illegal multibyte sequence
不知道这个是什么错误,就是把网页转换成gbk时候,报错,抓取其他网页都是好好的
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
谢谢
data = data.decode('GBK', 'ignore')
因为有些字符可能不在GBK里面,所以无法转换,忽略掉就好了。