在scrapy中修改CSV导出
我似乎缺少一些非常简单的东西。我想做的就是使用 ;
作为 CSV 导出器中的分隔符而不是 ,
。
我知道 CSV 导出器将 kwargs 传递给 csv 编写器,但我似乎不能 弄清楚如何传递这个分隔符。
我这样称呼我的蜘蛛:
scrapy crawl spidername --set FEED_URI=output.csv --set FEED_FORMAT=csv
I seem to be missing something very simple. All i want to do is use ;
as a
delimiter in the CSV exporter instead of ,
.
I know the CSV exporter passes kwargs to csv writer, but i cant seem to
figure out how to pass this the delimiter.
I am calling my spider like so:
scrapy crawl spidername --set FEED_URI=output.csv --set FEED_FORMAT=csv
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
在
contrib/feedexport.py
中,您需要自己制作,这里有一个示例:
在爬虫目录的
settings.py
文件中,添加以下内容:现在,您可以按如下方式执行你的蜘蛛:
HTH。
In
contrib/feedexport.py
,You will need to make your own, here's an example:
In the
settings.py
file of your crawler directory, add this:Now, you can execute your spider as follows:
HTH.
scraper/exporters.py
scraper/settings.py
在终端中
scraper/exporters.py
scraper/settings.py
In terminal
我也尝试过这也可以工作:
第1步:修改
C:\Python27\Lib\site-packages\scrapy\exporters.py
第21行添加
'TxtItemExporter'
到原始__all__
列表。第2步:将名为TxtItemExporter的新类添加到
C:\Python27\Lib\site-packages\scrapy\exporters.py
:新类是从CsvItemExporter复制的,并且仅将
delimiter='\t'
添加到csv.writer()
Step3: 将以下设置添加到
settings.py
第4步:运行
scrapy scrapy your_spider
,然后您可以在您的spider项目目录中找到输出txt。I also tried this can work too:
Step 1: Modify
C:\Python27\Lib\site-packages\scrapy\exporters.py
line 21 toThis add
'TxtItemExporter'
to original__all__
list.Step 2: Add a new class named TxtItemExporter to
C:\Python27\Lib\site-packages\scrapy\exporters.py
:The new class is copied from CsvItemExporter and only add
delimiter='\t'
tocsv.writer()
Step3: Add following settings to
settings.py
Step 4: Run
scrapy crawl your_spider
and then you can find the output txt in your spider project directory.