htmlparser解析网页爬虫
在爬取网页时,出现下面这样的错误,如何解决?
org.htmlparser.util.ParserException: Exception getting input stream from http://www.dianping.com/shop/10335116 (Server returned HTTP response code: 403 for URL: http://www.dianping.com/shop/10335116).;
java.io.IOException: Server returned HTTP response code: 403 for URL: http://www.dianping.com/shop/10335116如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(5)
一般大网站对同一IP的大量访问都有防御措施的。 试试换IP吧。
引用来自“zheng_pat”的评论
爬的太多,被封杀了吧,找出规律,定时修改下头信息
引用来自“蟋蟀哥哥”的评论
403,改改频率和head呢
爬的太多,被封杀了吧,找出规律,定时修改下头信息
403,改改频率和head呢