pyspider在抓取一周前on_start中设置url
更新了on_start中的url地址,一周后程序仍在抓取旧的url,如果彻底清除旧的url? 需求中这个url列表可能会经常变化。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
更新了on_start中的url地址,一周后程序仍在抓取旧的url,如果彻底清除旧的url? 需求中这个url列表可能会经常变化。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
你使用了 auto_recrawl ?
你可以使用 http://docs.pyspider.org/en/l... 取消掉
如果url 是变化的,建议使用 @cronjob 而不是 auto_recrawl