pyspider下无法web预览页面

发布于 2022-09-02 14:15:12 字数 1186 浏览 9 评论 0

1 在demo.pyspider.org/debug/sask 建立了任务

2 采集的目标网站为https://sasktenders.ca/Content/Public/Se...

3 问题:web界面下 html可以显示源码,但web预览无法查看,怀疑是ajax问题 已增加fetch_type='js'的选项 但还是显示不出来 求帮助

clipboard.png

代码如下:

#!/usr/bin/env python
# -*- encoding: utf-8 -*-
# Created on 2016-04-04 15:28:30
# Project: sask

from pyspider.libs.base_handler import *


class Handler(BaseHandler):
    crawl_config = {
    }

    @every(minutes=24 * 60)
    def on_start(self):
        self.crawl('https://sasktenders.ca/Content/Public/Search.aspx',fetch_type='js', callback=self.index_page)

    @config(age=10 * 24 * 60 * 60)
    def index_page(self, response):
        for each in response.doc('a[href^="http"]').items():
            self.crawl(each.attr.href, callback=self.detail_page)

    @config(priority=2)
    def detail_page(self, response):
        return {
            "url": response.url,
            "title": response.doc('title').text(),
        }

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

远山浅 2022-09-09 14:15:12

这个页面设置了 <meta http-equiv="X-Frame-Options" content="deny" />
不允许在 web 页面中显示

触ぅ动初心 2022-09-09 14:15:12

请问这个问题你解决了吗?能否分享哈,谢谢!

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文