Scrapy

Scrapy

文章 673 浏览 210

尝试将文本与标题分开

我想从输出中删除这些:我只想要这些 Wave Coffee Collection '\n\n\t\t3rd Wave Coffee Collection\n\t\t\t\t\n\t' 这是我的代码: from scrapy.http…

为你拒绝所有暧昧 2025-01-12 04:16:46 0 0

Scrapy 中的 Errback 蜘蛛不会触发

下面的代码不会调用 errback: error_handler。可能是什么问题?然而,它确实到达了 parse_listings 并引发了 scrapy 捕获并记录的异常。 import scrap…

陪我终i 2025-01-11 20:39:19 0 0

Web Crawler - 使用 Scrapy 迭代 Postgres 数据库结果

我正在尝试编写一个 scraper 从数据库结果中获取域。我能够从数据库获取数据,但我不知道如何将其提供给 Scrapy。我在这里查看并找到了很多建议,但没…

温柔一刀 2025-01-11 19:46:45 0 0

XPath 选择以下直到某些条件?

我在从以下节点选择产品时遇到问题。这是 html: Order ID 1 product 1 Order ID 2 product 1 product 2 Order ID 3 product 1 product 2 Order ID 4 …

一瞬间的火花 2025-01-11 19:02:54 0 0

Scrapy CrawlSpider:在提取链接之前获取数据

在CrawlSpider中,如何在提取每个链接之前抓取图像中“4天前”标记的字段? 下面提到的 CrawlSpider 工作正常。但在“parse_item”中,我想添加一个名…

意中人 2025-01-11 18:06:39 0 0

如何使用Scrapy进行分页并访问每个页面上找到的所有链接

我有以下蜘蛛,我尝试结合分页和规则来访问每个页面上的链接。 import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders…

滿滿的愛 2025-01-11 17:08:47 0 0

scrapycrawlspider与splash不执行process_request

我有一个带有splash的scrapy的crawlspider,以便爬行阿里巴巴网站以进行学习。但我的蜘蛛不会执行规则中的 process_request 函数来执行启动请求。结果…

灵芸 2025-01-11 16:04:20 0 0

如何抓取将鼠标悬停在元素上时出现的文本?

所以在电子商务网页上(https://www.jooraccess.com/r/products?token=feba69103f6c9789270a1412954cf250)当我将鼠标悬停在产品上时,会显示产品的颜…

红颜悴 2025-01-11 06:22:56 0 0

为什么我的蜘蛛不执行解析函数,但使用另一个链接它可以工作?

我试图从此页面中提取一些数据,但解析函数未执行,我尝试放置另一个 URL(例如 google.com 的 URL)并执行,但对于我需要的页面却没有执行 import sc…

眉黛浅 2025-01-11 05:58:56 0 0

如何实现“ThreadPoolExecutor”在Python中?

事实上,我已经抓取了“Nykaa 网站”。但问题是获取完整数据需要大约 10 天。这是非常耗时的。 基本上,我想优化或自动化此代码,因此它需要最少的时…

白色秋天 2025-01-11 03:17:09 0 0

如何使用Scrapy修正循环链接?

我正在使用 Scrapy,在循环链接时遇到一些问题。 我从一个页面中抓取了大部分信息,除了指向另一页面的信息。 每页有 10 篇文章。对于每篇文章,我都…

梅倚清风 2025-01-10 19:54:46 0 0

如何使用 BeautifulSoup 从网页中抓取图像?

请原谅我的无知,但我无法理解这一点。我必须提出一个新问题,因为我意识到我真的不知道该怎么做。那么如何从这样的网页中抓取图像 https://www.joora…

安人多梦 2025-01-10 14:57:56 1 0

Xpath 纠正它

这是我的输出:我想从输出中删除这些 '4.9 out of 5 star', '1,795 ratings', '4.9 out of 5 stars', '1,795 ratings', '#3,626 in Kitchen & Dining …

笑,眼淚并存 2025-01-10 13:37:17 1 0

使用 scrapy 抓取列出的 HTML 值

我似乎不知道如何构造这个 xpath 选择器。我什至尝试使用 nextsibling::text 但无济于事。我还浏览了 stackoverflow 问题来抓取列出的值,但无法正确…

权谋诡计 2025-01-10 13:22:54 1 0

在scrapy中获取与给定页面中的href元素关联的文本

目前,我的 scrapy 蜘蛛中的“产量”如下所示: yield { 'hreflink':mylink, 'Parentlink':response.url } 这将返回一个字典 { 'hreflink':"https://w…

两个我 2025-01-10 09:45:00 0 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文