pyspider不能自动运行

发布于 2022-09-03 15:27:25 字数 593 浏览 7 评论 0

1、点run能够爬取；
2、设置minutes=10 ,auto_recrawl=True
3、running状态任务并不能自动到时间自动爬取（磁盘有足够空间）
4、把pyspider终止再运行能爬取几条后，又会停止不动
下图是ssh里的把要爬的一部分url爬取为active后的状态（事实上有数据可以爬）
图片描述

5、webui顶部一直是scheduler100 fetcher100
任务列表也不更新了
显示下图：只见active，不见success
图片描述

6、系统环境：centos7 64位，pyspider0.3.8（git版），硬件是树莓派3

请问在哪里排查故障原因，怎么解决呢？
谢谢

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

逆夏时光 2022-09-10 15:27:25

你在脚本里干嘛了？长时间执行不返回。

回复收藏 0

滥情稳全场 2022-09-10 15:27:25

page_detail里是普通的获取文章内容，
只是在on_result里重写了POST发布到远程库（数据库链接操作测试是正常的）。

另外请问下，使用.json配置文件后还怎么启用多个fetcher或processor组件呢？谢谢~
{
"taskdb": "mysql+taskdb://luring:123@127.0.0.1:3306/taskdb",
"projectdb": "mysql+projectdb://luring:123@127.0.0.1:3306/projectdb",
"resultdb": "mysql+resultdb://luring:123@127.0.0.1:3306/resultdb",
"message_queue": "redis://127.0.0.1:6379/db",
"scheduler" : {

"xmlrpc-host": "0.0.0.0",
"delete-time": 3600

},
"webui": {

"port": 5000,
"username": "luring",
"password": "123",
"need-auth": true

}
}

回复收藏 0

~没有更多了~

关于作者

Smile简单爱

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

pyspider不能自动运行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

pyspider不能自动运行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。