pyspider,遇到超时599,能否设置爬虫超时则跳过爬取,避免进入pause状态
爬取页面时,有的url存在重定向
获取的url为: https://www.thepaper.cn/newsDetail_forward_12149631
点进去后变成了:http://www.kankanews.com/a/20...
用pyspider请求获取的url时会报超时错误,报错多了之后会导致爬虫进入pause状态停止。希望能够设置,避免爬虫停止
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论