python爬虫

python爬虫

文章 460 浏览 21

python爬虫,爬出来和源码不同

求教,爬移民家园的网站,爬不到有效内容,这是为什么,怎么才能爬到具体的帖子内容?(附图是用下面的代码爬下来的内容)import urllib.request url …

沫离伤花 2022-09-12 04:50:55 31 0

python爬虫禅道上周不同人员提的bug数,给定不同参数,返回的结果都是同一个?

学习python爬虫的过程中,想要对禅道上周不同人员提bug数进行统计经过研究,发现这个页面需要先进行post去访问接口,然后再调用get来展示这个页面。我…

仅冇旳回忆 2022-09-12 04:46:06 16 0

有人知道怎么用xpath获取下一页标签,这个标签没有class,没有id,如图

在学习selenium过程中遇到的这个问题,发现没法实现下一页点击了…

我的黑色迷你裙 2022-09-12 04:45:26 12 0

Python用Scrapy做爬虫,会绕过selenium不好绕的反扒吗?

Python之前用selenium和和requests写了一些脚本爬淘宝,开始6月先是cookie改版,但是改了也能将就用,后来就是反爬虫用js 检测webdriver……再后来又…

信愁 2022-09-12 04:37:17 23 0

求助 xpath如何匹配多个标签 类似或语法

目标网站:https://mp.weixin.qq.com/s/ECFS_A5JTMB_TvS8AB836Q网站的文字内容在section 和 p 两种标签下匹配结果如下求助 我想同时匹配 这2个标签 应…

定格我的天空 2022-09-12 04:16:37 16 0

Node.js getaddrinfo ENOTFOUND, 请求一个接口, 偶尔会报这个错误.

因为是一个爬虫服务, 所以会请求其他的网站的接口. 用的客户端是 superagent, 偶发的报错 getaddrinfo ENOTFOUND. 报错以后立马重试, 依旧会报这个错…

蓝咒 2022-09-12 04:15:23 20 0

请问如何在mitmdump的基础上编写python脚本获得request请求

如图如题所示,我按照网上给的代码编写了脚本,但是每次调用时总显示失败,在pycharm上写的时候也没给什么报错,请问是这个编写的脚本代码有问题吗?…

德意的啸 2022-09-12 04:04:44 28 0

cookie:a=b;c=d;e=f这种格式与cookie:a=b cookie:c=d cookie e=f这种有什么区别吗

抓包的时候发现发送的cookie是这种个格式但是正常来说我之前见过的都是这种所以想问一下,这两种cookie的发送有什么区别吗?如果没有区别的话,为什么…

前事休说 2022-09-12 03:59:46 38 0

mitmproxy和gerapy的依赖库冲突该如何解决

用pipenv创建了虚拟环境先安装了mitmproxy库,其中的依赖 cryptography&lt3.0,&gt=2.9 (from mitmproxy==5.2-&gt-r 后面又安装gerapy,其中也依赖这个…

⊕婉儿 2022-09-12 03:57:14 13 0

scrapy启动后导入自建模块失败,找不到,哪里出了问题?

已经标记源码根了(解除又标记了几次),scrapy项目crawl启动后提示找不到自建的py文件,导入失败,sys.path.append也不行,运行单个py文件却能正常使…

孤蝉 2022-09-12 03:56:58 29 0

爬取app信息如何更新header?

如题,本菜用charles获取共享汽车evcard app的curl代码,然后用python爬取数据,在爬数据的时候发现每过一段时间就会发现header过期 如成功获取请求的…

懵少女 2022-09-12 03:53:48 33 0

python爬虫requests库 无法获得网页上的某个标签的信息

学习爬虫的时候发现自己某个标签无法获得 本人是爬虫初学者,在学习爬取爬虫的时候发现某个标签无法获得,想要爬取的网站叫优书网,网址为https://www.y…

岁吢 2022-09-12 03:19:34 12 0

b站爬取固定时段的视频信息,怎么获取视频号?

问题描述 现在b站改BV号之后没啥规律了,怎么根据时间找到这段时间内发布的视频? 之前每一个新视频都是av号+1,现在虽然av号可查,但是不是顺序递增…

夏日浅笑〃 2022-09-12 03:09:01 22 0

请问用LXML为什么无法爬取到指定网页中的这条信息?

https://www.che168.com/dealer/357032/37286245.html?pvareaid=100519&ampuserpid=0&ampusercid=0&ampoffertype=0#pos=1#page=1#rtype=10#isrecom=0…

完美的未来在梦里 2022-09-12 03:07:02 9 0

请教如何正则匹配出信息中的两段数字

这几天在爬一点车辆信息/dealer/357032/37286245.html?pvareaid=100519&ampuserpid=0&ampusercid=0&ampoffertype=0#pos=1#page=1#rtype=10#isrecom=0…

简美 2022-09-12 03:06:55 18 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文