爬虫爬目标网站出现512错误怎么解决?
1.问题
昨天爬好好的,然后开了五个线程果断被封IP, 今天继续爬,没有封IP,但是爬不了,直接报错512错误
2.错误信息
[WARN][2016-05-13 11:40:20,977][us.codecraft.webmagic.downloader.HttpClientDownloader]code error 521 https://xxxxxx.com/
报错的代码段
if (statusAccept(acceptStatCode, statusCode)) {
Page page = handleResponse(request, charset, httpResponse, task);
onSuccess(request);
return page;
} else {
logger.warn("code error " + statusCode + "\t" + request.getUrl());
return null;
}
3.尝试的修改方案
加了请求头,然而并没有什么卵用
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
https://github.com/JerelLin/bilibili
到底是512 还是521啊? 而且状态吗也没有521 或者 512 啊