Scrapy

Scrapy

文章 673 浏览 208

我应该创建管道来使用 scrapy 保存文件吗?

我需要保存文件 (.pdf),但我不确定如何操作。我需要保存 .pdf 并将它们存储在一个目录中,就像它们存储在我正在刮掉它们的网站上一样。 据我所知,我…

℡寂寞咖啡 2024-11-30 05:40:19 1 0

使用 Scrapy for Python 从 html 路径中提取数据

我的项目概述: 我正在尝试在 python 2.6 中创建一个简单的脚本,该脚本将从 Bing 地图获取交通时间数据。我使用 Scrapy 库模块包 (scrapy.org/) 来爬…

獨角戲 2024-11-29 22:18:31 1 0

无法让 Scrapy 跟踪链接

我正在尝试抓取一个网站,但无法使用 scrapy 来跟踪链接,也没有收到任何 Python 错误,而且 Wireshark 也没有看到任何情况。我认为这可能是正则表达…

南冥有猫 2024-11-29 06:01:55 0 0

在管道中使用 POST 请求保留项目

我想将项目保留在管道中并将其发布到网址。 我在管道中使用此代码 class XPipeline(object): def process_item(self, item, spider): log.msg('in Spo…

美人迟暮 2024-11-27 18:10:51 0 0

为什么要以二进制模式打开 xml 文件以在 Python 中进行编辑?

根据 Pydocs, fp = file('blah.xml', 'w+b') or fp = file('blah.xml', 'wb') 表示以写入和二进制模式打开文件。然而,这是一个 xml 文件,那么为什…

南笙 2024-11-27 04:28:21 0 0

Python 如何与 javascript 一起工作

我正在开发一个 scrapy 应用程序来抓取网页上的一些数据 ,但是有一些数据是由 ajax 加载的,因此 python 无法执行它来获取数据。 有没有模拟浏览器行…

无人问我粥可暖 2024-11-26 20:18:47 0 0

单击 Scrapy 中的按钮

我正在使用 Scrapy 来抓取网页。我需要的一些信息只有在点击某个按钮时才会弹出(当然点击后也会出现在HTML代码中)。 我发现 Scrapy 可以处理表单(…

默嘫て 2024-11-24 03:13:06 0 0

Python Scrapy 框架发布错误图像 - 为什么/如何解决这个问题?

我正在使用 Python 的 Scrapy 框架从一个网站抓取多个条目,包括文本和图像,并将它们一一发布到另一个网站。一切正常,只是发布的图像与错误的对应文…

难以启齿的温柔 2024-11-19 21:13:20 2 0

Python爬行蜘蛛

我一直在学习如何使用 scrapy,尽管我一开始对 python 的经验很少。我开始学习如何使用 BaseSpider 进行抓取。现在我正在尝试抓取网站,但我遇到了一…

淡淡離愁欲言轉身 2024-11-19 15:05:44 3 0

Scrapy 中的验证码

我正在开发一个 Scrapy 应用程序,我正在尝试使用使用验证码的表单(这不是垃圾邮件)登录到一个网站。我正在使用 ImagesPipeline 下载验证码,并将其…

浅沫记忆 2024-11-19 12:40:08 2 0

使用 python scrapy 将项目抽出到 csv 文件 - 如何在 csv 文件中输出的问题

有一个问题,我想将输出添加到 csv 文件,但它不会在字段名称下方开始,而是按顺序放置在下一行中,而不是在填充 csv 文件中的playerMins 项目时将其…

风透绣罗衣 2024-11-19 07:53:50 2 0

Scrapy中间件订单

Scrapy 文档 说: 第一个 中间件是最接近的一个 发动机,最后一个更接近 到下载器。 决定分配给哪个订单 你的中间件看到 DOWNLOADER_MIDDLEWARES_BASE…

吹梦到西洲 2024-11-18 23:40:01 2 0

以下链接,Scrapy 网络爬虫框架

在阅读了几次 Scrapy 文档之后,我仍然没有意识到使用 CrawlSpider 规则和在回调方法上实现我自己的链接提取机制之间的区别。 我即将使用后一种方法编…

我乃一代侩神 2024-11-18 18:42:28 3 0

Scrapy,URL 上的哈希标签

我正在使用 Scrapy 进行一个报废项目。 我意识到 Scrapy 将 URL 从哈希标签剥离到末尾。 这是 shell 的输出: [s] request [s] response 这确实影响了…

分開簡單 2024-11-18 17:15:19 2 0

ImportError:Scrapy for python 不再工作,没有名为 scrapy.cmdline 的模块

运行 Scrapy 会产生错误: ImportError: No module named scrapy.cmdline 我查看了一下,发现该模块位于正确的位置。可以通过创建新的环境变量来解决…

眉目亦如画i 2024-11-18 14:59:04 3 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文