一个Python爬虫字符串相关的错误?
用Python爬豆瓣日记,将页面以html格式保存。其中至少20篇日记保存正常,某篇报错。错误信息如下。
是字符编码方式的错误吗,应该如何解决?
该日记名可在终端正常显示。
file_object = open(dir + '/' + article + '.html', 'w')
IOError: [Errno 2] No such file or directory: 'dir/Even artichokes have doubts - \xe4\xb8\x80\xe4\xb8\xaaYALE\xe5\xa5\xb3\xe7\x94\x9f\xe5\xaf\xb9\xe4\xba\x8eIB/Consulting\xe7\x9a\x84\xe8\xb4\xa8\xe7\x96\x91.html'
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
因为日志标题包含
IB/Consulting
字符串,也就是说有斜杠。而 HFS+ 的文件名是不允许有/
的。