当前位置：文江博客话题详情

Python PySpider

爬虫没有按配置的时间运行，是为什么？

发布于 2022-09-04 01:34:12 字数 1421 浏览 13 评论 0

需求是这样，我把所有的url存在了mongo库，想每天查一遍url，抓一遍数据，可是周末并没有执行，

图片描述
这个项目的日志

项目配置是这样的，我修改过几次itag，让项目重跑，别的项目也遇到几天不跑

 @every(minutes=10)
    def on_start(self):
        """运行入口"""
        self.crawl('data:, on_crawl_A', callback=self.crawl_A)
        
    @config(age=60,priority=3)     
    def crawl_A(self, response):
        for page in range(1, 549):
            params = {
                'page_index': page, 'size': self.PAGE_SIZE,
                'source': 'aaa',
            }
            self.crawl(self.DATA_SERVICE_URL, params=params,
                       callback=self.query_local_api, timeout=60, proxy=False)

    @config(age=2 * 60,priority=3)
    def query_local_api(self, response):
        data = json.loads(response.text)
        if data['msg'] != 'Success':
            return
        urls = [url for url in data['body'] if url.startswith("http://")]
        print 'urls len------>{}'.format(len(urls))
        for url in urls:
            self.crawl(url, callback=self.detail_page)
    @config(age=3 * 60 * 60,priority=10)
    def detail_page(self, response):

其中query_local_api 是查询本地mongo接口返回url，其实我想这样配置

@config(age=24 * 60 * 60,priority=10)
    def detail_page(self, response):

但是发现这个age怎么配都感觉抓的不对，我理解问题？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

街角迷惘 2022-09-11 01:34:12

你这个代码和你贴的这个图不一致啊，代码是10分钟运行一次，图上面是6小时
随便找一个你认为应该被的任务，在 debug 页面获取 taskid（左上的 json 里面有），到 /task/project:taskid 页面查看它当前的状态

暮光沉寂 2022-09-11 01:34:12

我最近在研究python写定时任务，你可以考虑下用apscheduler

奢华的一滴泪 2022-09-11 01:34:12

其实可以退一步看, 这个问题是可以利用*nix系统自带的crontab计划任务搞定的

偏闹i 2022-09-11 01:34:12

猜想：
会不会是因为你写的装饰器里边的处理的不对呢？

无畏 2022-09-11 01:34:12

现在正在研究用PHP写爬虫

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

22 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

謌踐踏愛綪

文章 0 评论 0

开始看清了

文章 0 评论 0

高速公鹿

文章 0 评论 0

alipaysp_PLnULTzf66

文章 0 评论 0

热情消退

文章 0 评论 0

白色月光

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文