使用邮政方法进行废弃错误
我正在使用scrapy的帖子方法,但它们给我这些错误 typeError:__init __()有一个意外的关键字参数'data'是否有任何解决方案bascillay我尝试从表中进…
attributeError:' str'对象没有属性' xpath'碎屑python
我正在尝试从网页中提取值,但它使我获得了 attributeError 。我不确定为什么要打印此错误。如果您查看代码,您将找不到引起此错误的内容。实际上,第…
未找到针对类型的对象的适配器:' itemadapter.adapter.itemadapter'
我想更改从网页下载的图像的名称。我想使用网站给出的标准名称,而不是清洁请求URL。 我有以下管道。py from itemadapter import ItemAdapter from sc…
使用帖子方法刮擦多个页面
import scrapy from scrapy.http import Request from scrapy.selector import Selector from selenium import webdriver import time from scrapy_se…
如何在蜘蛛关闭之前存储所有刮擦的统计瞬间?
我想将从蜘蛛收集的所有统计数据存储到存储为JSON格式的单个输出文件中。但是,我得到了这个错误: 'memorystatsCollector'对象没有属性'get_all' :…
仅在爬行时仅抓取400误差,而不是在使用scrapy shell时
我正在收到400 HTTP状态代码,或者使用scrapy Crawl功能在 https://www.bbc.com/news/topics/c3np65e0jq4t 。我正在使用以下代码并命令来启动疤痕。 c…
python连接信号未被调用
我有以下文件和代码 import logging from scrapy import signals from scrapy.exceptions import NotConfigured logger = logging.getLogger(__name__…
请求设置logging_config与django一起使用时
我是砂纸和Django集成的新手,但是我正在尝试一些简单的事情,以使我的职业生涯与两者一起发展。本质上,我想从网站上获取标题,模型将阅读此信息,并…
如何故障排除冰期壳响应403错误
几个月前房地产清单网页,它运行得很好。 我从Firefox(开发人员Tools - >标题)中拉出 cookie 用户代理加载目标URL时,我将获得成功的响应 (200…
刮擦信息时列表错误的列表错误
我正在尝试提取信息,但他们会给我不可变的列表错误,这些是链接 https://rejestradwokatow.pl/adwokat/abaewicz-agnieszka-51004 import scrapy from…