python爬虫

python爬虫

文章 460 浏览 23

[python爬虫] xpath没错,但运用scrapy框架无法爬到数据

初学scrapy,我用python爬虫时使用scrapy框架爬取‘简书’的一些内容运行爬虫后,爬虫就关闭了,但什么内容都没爬取到网上类似的问答基本都说是xpath…

罗罗贝儿 2022-09-06 21:31:10 13 0

python爬虫网页,为啥始终无法爬出翻页的内容?

爬出来始终是第一页的内容 import requests from requests.exceptions import RequestException from pyquery import PyQuery as pq import re impor…

糖果控 2022-09-06 21:29:11 10 0

scrapy爬虫如何引用外部的函数作为爬取成功后的回调函数

我想在spider爬虫文件中调用不同的回调函数来处理不同的页面,如果回调函数在当前页面写的话是没有问题的,但是现在我想在外部写好回调函数,然后在…

你的他你的她 2022-09-06 21:05:11 17 0

如何利用scrapy爬取网站中的图片并替代原来的图片?

针对某个网址我想:1、将所有的图片下载到自己的服务器上2、将原网页的图片路径替换成自己服务器上的图片路径3、将图片替换后的带标签的原网页保存到…

小梨窩很甜 2022-09-06 19:27:51 15 0

请问这个商标网上检索系统怎么破啊

http://wsjs.saic.gov.cn/是这样的.我想用list传入搜索所有结果并自动爬取页面,但是遇到了很多问题.这个网站貌似都是js+md5加密的,而且搜索结果一旦刷…

信仰 2022-09-06 15:50:16 18 0

如何获取b站某分区所有视频的av号

比如在https://www.bilibili.com/v/te...想要获取科技分区下,趣味科普人文版块的所有视频av号,通过修改网址上的页码可以模拟翻页,但是想看见每一页…

不打扰别人 2022-09-06 15:35:41 11 0

python爬虫如何获取X-CSRF-Token

我在爬取LOL比赛信息时(http://www.wanplus.com/schedu...),遇到这个问题: headers3 = { "Accept": "application/json, text/javascript, */*; q…

多彩岁月 2022-09-06 15:25:44 15 0

scrapy Download Middleware 返回response后无法执行回调函数

问题:scrapy Download Middleware 返回response后无法执行回调函数 代码: 如图所示,这个是判断网盘连接是否有效的middleware,正常情况下,return…

旧人九事 2022-09-06 15:19:16 21 0

python3.x如何使用代理IP

我调用我抓取的代理IP和请求头进行爬虫,但是总是反馈失败,我检查了IP,发现也没问题,到底如何正确使用getRandomProxy()是调用随机选择一个代理ip …

初相遇 2022-09-06 15:12:19 29 0

Scrapy shell报错 'StreamLogger' object has no attribute encoding?

在命令行中准备输入scrapy shell www.baidu.com,得到结果:以前从没发生过这种事情,请问这是什么情况??…

女皇必胜 2022-09-06 15:07:14 19 0

scrapy入门示例

http://scrapy-chs.readthedocs... 示例网站挂了? 403 Forbidden Code: AccessDenied Message: Access Denied RequestId: B26B2ADB27F2E29E HostId:…

苏璃陌 2022-09-06 12:21:19 14 0

Scrapy的callback为什么没有实现

我很好奇为什么第14行的代码没有实现,我查了一下发现在yield scrapy.Request(url, callback=self.parse_stock)之前的所有代码都是没有问题的,但是…

陈年往事 2022-09-06 12:12:31 25 0

Python字符转化问题

https://www.noscodespromo.com...爬取这个页面的时候,已经字符转义(头部import sysreload(sys)sys.setdefaultencoding('utf-8')也对源码进行decode("…

多谢你的绝情让我学会死心 2022-09-06 11:58:33 12 0

Python3 Scrapy框架中进入callback函数,但第一级取的值存入数据库中都重复

-- coding: utf-8 -- import scrapy,refrom scrapy.selector import Selectorfrom scrapy.http import Requestfrom novelspider.items import Novels…

等你爱我 2022-09-06 11:56:49 11 0

豆瓣模拟登陆保存Cookie后下次直接登陆失败

问题描述 一个模拟登陆豆瓣的python小程序,对于正常输入用户名和密码进行登陆正常,但是当我第一次登陆成功后将cookie保存下来下次使用cookie而不用…

花之痕靓丽 2022-09-06 11:45:33 26 0
更多

推荐作者

隔纱相望

文章 0 评论 0

昵称有卵用

文章 0 评论 0

梨涡

文章 0 评论 0

蓝咒

文章 0 评论 0

白芷

文章 0 评论 0

樱娆

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文