scrapy imagepipline：创建了简单的示例，运行/测试它的命令是什么

发布于 2025-01-07 14:22:58 字数 1044 浏览 2 评论 0原文

我按照这个文档使用 scrapy 下载图像。 http://doc.scrapy.org/en/latest/topics/images.html具体来说

，我会有这个 test.py：

from scrapy.contrib.pipeline.images import ImagesPipeline
from scrapy.exceptions import DropItem
from scrapy.http import Request

from My.items import ImageItem

item = ImageItem()
item['image_urls'] = ['http://url/123.jpg']

class MySpider(ImagesPipeline):

    def get_media_requests(self, item, info):
        for image_url in item['image_urls']:
            yield Request(image_url)

    def item_completed(self, results, item, info):
        image_paths = [x['path'] for ok, x in results if ok]
        if not image_paths:
            raise DropItem("Item contains no images")
        item['image_paths'] = image_paths
        return item

我的问题是：我应该运行什么命令行来测试这个 test.py 以验证图像是否已下载。

更多信息：我知道命令“scrapycrawlproject_name”，但我更喜欢测试这个test.py，而不必创建项目。

还遇到“scrapy runningpider test.py”，但它不起作用。错误：未找到 MySpider。

原文

I follow this docs to download images using scrapy.
http://doc.scrapy.org/en/latest/topics/images.html

Specifically, I would have this test.py:

from scrapy.contrib.pipeline.images import ImagesPipeline
from scrapy.exceptions import DropItem
from scrapy.http import Request

from My.items import ImageItem

item = ImageItem()
item['image_urls'] = ['http://url/123.jpg']

class MySpider(ImagesPipeline):

    def get_media_requests(self, item, info):
        for image_url in item['image_urls']:
            yield Request(image_url)

    def item_completed(self, results, item, info):
        image_paths = [x['path'] for ok, x in results if ok]
        if not image_paths:
            raise DropItem("Item contains no images")
        item['image_paths'] = image_paths
        return item

My question is: what is command line I should run to test this test.py to verify if images are downloaded.

Further info:
I know the command "scrapy crawl project_name" but I prefer to test this test.py without having to create a project.

Also come across "scrapy runspider test.py" but it does not work. Error: MySpider not found.

分享到QQ

分享到微博