Scrapy

Scrapy

文章 673 浏览 211

可以使用零食从顽固的网页中获取JSON内容

我正在尝试使用scrapy创建一个脚本来从此网页。我已经在脚本中使用了标题,但是当我运行它时,我总是会得到 jsondecodeerror 。该站点有时会投掷验证…

对岸观火 2025-02-09 03:34:00 2 0

Python砂纸我可以获取任何数据

from urllib import parse import scrapy from scrapy.linkextractors import LinkExtractor import codecs import json class WanikaniSpider(scrapy…

情场扛把子 2025-02-09 02:25:24 2 0

解决这些错误如何无法混合str和非STR参数

他们向我展示了这些错误,即无法混合str和非STR参数我正在编写一些刮擦代码,并经历了上述错误。我的代码正在关注。但是,通过CMD运行脚本后。我遇到…

没企图 2025-02-09 01:56:25 2 0

使用过滤条件将刮擦数据保存在不同词典中

我已经从同一蜘蛛刮了2个URL,如下所示: def start_requests(self): #calling Dawn Categories yield Request('https://www.dawn.com/business',call…

往事风中埋 2025-02-08 16:22:12 3 0

用飞溅请求刮擦返回空的

我试图刮擦一个烹饪网站,但徒劳无功。我已经用硒做到了,但是有点慢。所以我正在尝试进行砂纸,但是它总是返回的总是空字符串 我还根据第1-5步中修改…

霓裳挽歌倾城醉 2025-02-08 09:03:08 2 0

递归python功能的递归呼叫

我正在尝试使用Python从API中解析一些JSON。结果分为100组,其中 nextPagelink 在JSON链接到下一页的JSON中。 我有一个类,带有解析器,在击中 nextPa…

掀纱窥君容 2025-02-08 08:10:03 2 0

如何将数据从烧瓶API传递给Web刮板?

我正在研究一个应用程序项目,该项目允许用户输入一组将要询问的关键字后获得网页搜索结果。为此,我创建了一个瓶中的API,并受到以下文章的启发,该…

﹏半生如梦愿梦如真 2025-02-08 07:22:39 2 0

使用砂纸取得刮擦数据,而不是文件/数据库

我正在尝试将零食作为Python脚本运行,并希望处理刮擦的数据,而不是存储在文件/数据库中。该代码看起来 import scrapy import scrapy.crawler as cra…

小镇女孩 2025-02-08 03:50:59 2 0

为什么登录不进行废弃

我正在尝试创建登录程序来登录,但这不起作用。 import scrapy from scrapy.http import FormRequest from scrapy.utils.response import open_in_bro…

寒尘 2025-02-08 00:21:39 2 0

刮擦具有页面限制的网络网络

我正在尝试刮擦 https://www.olx.com.eg/en/properties/ 列表和其中显示了 200,000多个广告,我想刮擦所有200,000个列表,但分页并不超过49页。我已经…

菩提树下叶撕阳。 2025-02-07 23:40:18 2 0

我该如何运行废纸在废纸项目文件夹外

(1)我想使用process.crawl('spidername')运行scrapy,但WDIR不是Scrapy项目目录 就像这样: workspace ├─ scrapy_project │ ├─ project_name…

掌心的温暖 2025-02-07 21:56:26 2 0

为什么要进行零工selector.css retuen空白列表

def parse(self, response): sel=scrapy.Selector(response) items_list=sel.css('#main > div.containerbox.boxindex > div.layui-row.layui-col-sp…

如果没有 2025-02-07 18:50:00 2 0

每当我更改解析功能零食时,都不起作用并引发错误?

from scrapy import Spider from selenium import webdriver from scrapy.selector import Selector from scrapy.http import Request from selenium.…

你又不是我 2025-02-07 08:26:56 2 0

单击在硒中不起作用的按钮+砂纸

我想使用Scrapy + Selenium刮擦到新闻文章的链接。我使用的网站使用“更多负载”按钮,因此我显然希望Selenium单击此按钮以加载所有文章。 我已经寻找…

清风不识月 2025-02-07 05:30:55 0 0

为什么会赢得下一页呢?

我很困惑,为什么砂纸不会在以下代码中提取下一页的链接。我相信这可能与每个链接都有 index.php 的URL有关的事实。它是否不起作用,因为我必须根据每…

我不咬妳我踢妳 2025-02-07 03:39:33 1 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文