webmagic 抓取数据在时候遇到非法访问

发布于 2021-11-25 13:32:43 字数 140 浏览 476 评论 3

最近开始尝试做个爬虫,挑了挑,后来选了 webmagic ,从一个网站上也抓下来数据了感觉蛮好。可是换了个网站发现这网站的数据在页面是没有的,都是通过ajax请求得到的,更悲剧的是人家还做了拦截器,不能直接模拟浏览器访问ajax那些取数据的链接地址。这可怎么办?急求解决方案。。。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

吃颗糖壮壮胆 2021-12-01 00:52:30

无解了?那就是说?

英雄似剑 2021-11-30 14:07:58

这个没有什么办法吧  人家就是不想让你爬

初见你 2021-11-29 14:51:43

爬虫ajax的页面参考文档http://webmagic.io/docs/zh/posts/chx-cases/js-render-page.html   

如果人家做了拦截那就无解了 ,除非知道别人拦截的规则是什么,有没有办法绕过

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文