node 爬虫问题

发布于 2022-09-07 23:56:48 字数 156 浏览 26 评论 0

使用superagent请求某网页，网页不是ssr页面数据都是走接口获得（我知道正常来讲直接爬接口就好，但是我有个特别需求非要这样- -），
我希望通过cheerio分析页面形式获得数据，使用cheerio load请求到的html，但有时load完的html上会没有数据，请问这是怎么回事？

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

南笙 2022-09-14 23:56:48

原来是被网站反爬虫了

回复收藏 0

淤浪 2022-09-14 23:56:48

你都说了，网页不是server side render的。大概率是浏览器里面用js 继续拉取资源，动态渲染的。

这种情况下，直接看chrome的网络，看看都请求了什么资源，依次排查，找到你想要的，然后针对那个url抓取核心数据。

回复收藏 0

~没有更多了~

关于作者

浪菊怪哟

暂无简介

文章

26 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

node 爬虫问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

node 爬虫问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。