用scrapy做了一个程序想定时爬,但是不知道在编译器上如何运行。请问有啥方法可以让scrapy在编译器上运行
你用pyhcarm,然后在它的控制台里输命令,创建的项目都在你工程里,很方便的啦~
1.定时爬:在类linux下有个叫crontab定时命令,通过它来定时执行脚本任务,而把运行scrapy爬虫的命令写进脚本里就可以了,通过系统crontab。在win系统下有个计划任务的,意思大致是一样的,你可以自己再去搜素一下去学习,网上都有类似的讲解。
2.scrapy再编译器上运行:以我用的pycharm编辑器举例,就是在你的spider同级目录中(不是在spider目录下)建立个run.py(叫啥都行),编辑内容为:
from scrapy.cmdline import execute execute(['scrapy', 'crawl', '你的爬虫名字'])
执行爬虫程序的时候,只需要执行这个文件就可以了。通过内容我们就知道了,其实就通过execute执行了scrapy的cmdline方法,在编辑器调用了scrapy的命令行执行程序而已,所以别的编辑器中也可以去尝试这么做。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(2)
你用pyhcarm,然后在它的控制台里输命令,创建的项目都在你工程里,很方便的啦~
1.定时爬:在类linux下有个叫crontab定时命令,通过它来定时执行脚本任务,而把运行scrapy爬虫的命令写进脚本里就可以了,通过系统crontab。在win系统下有个计划任务的,意思大致是一样的,你可以自己再去搜素一下去学习,网上都有类似的讲解。
2.scrapy再编译器上运行:以我用的pycharm编辑器举例,就是在你的spider同级目录中(不是在spider目录下)建立个run.py(叫啥都行),编辑内容为:
执行爬虫程序的时候,只需要执行这个文件就可以了。
通过内容我们就知道了,其实就通过execute执行了scrapy的cmdline方法,在编辑器调用了scrapy的命令行执行程序而已,所以别的编辑器中也可以去尝试这么做。