htmlparser解析网页爬虫

发布于 2021-11-28 03:19:10 字数 357 浏览 756 评论 5

在爬取网页时，出现下面这样的错误，如何解决？

org.htmlparser.util.ParserException: Exception getting input stream from http://www.dianping.com/shop/10335116 (Server returned HTTP response code: 403 for URL: http://www.dianping.com/shop/10335116).;

java.io.IOException: Server returned HTTP response code: 403 for URL: http://www.dianping.com/shop/10335116

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夜司空 2021-11-29 03:34:07

一般大网站对同一IP的大量访问都有防御措施的。试试换IP吧。

回复收藏 0

能否归途做我良人 2021-11-28 23:59:11

引用来自“zheng_pat”的评论

爬的太多，被封杀了吧，找出规律，定时修改下头信息

回复收藏 0

泪冰清 2021-11-28 23:33:03

引用来自“蟋蟀哥哥”的评论

403，改改频率和head呢

回复收藏 0

回忆凄美了谁 2021-11-28 22:38:20

爬的太多，被封杀了吧，找出规律，定时修改下头信息

回复收藏 0

彩扇题诗 2021-11-28 19:56:21

403，改改频率和head呢

回复收藏 0

~没有更多了~

关于作者

离去的眼神

暂无简介

文章

496 人气

关注发私信

裸钻

文章 0 评论 0

关注

执手闯天涯

文章 0 评论 0

关注

2401825754

文章 0 评论 0

关注

就此别过

文章 0 评论 0

关注

我为君王

文章 0 评论 0

关注

机场等船

文章 0 评论 0

友情链接

文江博客

htmlparser解析网页爬虫

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论