pyspider任务重新启动但是结果显示none

发布于 2022-09-07 11:33:20 字数 2218 浏览 11 评论 0

求指教,终端的报错看不太明白为啥返回是none,也不知道和on_result有什么关系

#!/usr/bin/env python
# -*- encoding: utf-8 -*-
# Created on 2018-05-22 15:22:51
# Project: demo

from pyspider.libs.base_handler import *
import pymongo


class Handler(BaseHandler):
    crawl_config = {
    }
    client = pymongo.MongoClient('localhost')
    db = client['trip']

    @every(minutes=30)
    def on_start(self):
        self.crawl('https://cn.tripadvisor.com/Attractions-g186338-Activities-London_England.html', callback=self.index_page)

    @config(age=60*20)
    def index_page(self, response):
        for each in response.doc('.attraction_type_group .listing_info  div.listing_title a').items():
            self.crawl(each.attr.href,callback=self.group_detail)
        for each in response.doc('#ATTR_ENTRY_ > div.attraction_clarity_cell > div > div > div.listing_info > div.listing_title > a').items():
            self.crawl(each.attr.href,callback=self.detail_page)
            
    def group_detail(self,response):
        for each in response.doc('.listing_title a').items():
            self.crawl(each.attr.href, callback=self.detail_page)
        print(response.doc('.current').text())
        if response.doc('.current').text() == '1':
            for next in response.doc('.pageNumbers a').items():
                self.crawl(next.attr.href,callback=self.group_detail)
        
            
    @config(priority=2)
    def detail_page(self, response):
        url = response.url
        name = response.doc('.heading_title').text()    
        rating = response.doc('.autoResize').text()
        address = response.doc('.address :nth-child(n+2)').text()
        phone = response.doc('.blEntry.phone > span').text()
        return {
            'url':url,
            "name": name,
            "rating": rating,
            'address':address,
            'phone':phone,
        }
    
    
    def on_result(self,result):
        if result:
            self.save_to_mongo(result)
            
    def save_to_mongo(self,result):
        if self.db['shdu'].insert(result):
            print('save to mongo',result)

图片描述

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

从来不烧饼 2022-09-14 11:33:20

遇到同样的问题,看终端log 是on start 直接跳到on finish 。怀疑中间哪里有报错。请问您解决了吗?

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文