当前位置：文江博客话题详情

Python 网页爬虫 python爬虫

python爬虫requests库无法获得网页上的某个标签的信息

发布于 2022-09-12 03:19:34 字数 661 浏览 16 评论 0

学习爬虫的时候发现自己某个标签无法获得

本人是爬虫初学者,在学习爬取爬虫的时候发现某个标签无法获得,想要爬取的网站叫优书网,网址为https://www.yousuu.com/bookst...
爬取的内容主要是图上的一些网文信息,具体可以看图:

但是发现自己使用request库的时候没有找到 <a>"爱潜水的乌贼"</a>的内容,但是其他的信息都能查到,使用debug调试可以看到我获得的网页代码

其中看到想要爬取的<a>此标签中包含的数据都在soup中变成了
此外我在soup的下面还是看到了我想看到的数据

但和我想的差距比较大,爬取数据并不是目的,相比数据(我还可以爬取json也能获得想要的数据),我更希望知道这是什么原因,希望能够得到您的~~~~解答

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

请恋爱 2022-09-19 03:19:34

1.代码问题

没有放上代码，不好判断你写的xpath或regex语法是否正确

2.页面渲染问题

看图能知道这个接口返回的是html页面。那么内部的a标签有可能不在返回的html页面中，而是通过其他的手段，比如动态请求返回数据，然后通过js渲染到html页面中。这个要具体分析，你给的地址不全，也不好判断

~没有更多了~

关于作者

暂无简介

文章

评论

588 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文