PySpider

PySpider

文章 349 浏览 54

pyspider mongodb 插入结果报错

爬取过程中遇到如下问题: [I 160115 16:07:55 scheduler:671] task done douban:365c9df4123aa5e6969ffaa68c3de8a8 http://www.douban.com/note/388…

不甘平庸 2022-09-02 00:37:16 10 0

pyspider mongodb onresult 报错

如题,按照网上的例子写了个on_result,如下 def on_result(self, result): con=MongoClient('mongodb://localhost:27017') resultdb=con.spider resu…

那支青花 2022-09-02 00:22:53 6 0

pyspider +mongodb 多个爬虫 result 如何指定 collection 名称

如题,我现在需要爬取多个网站的内容,但是结果结构是一样的。现在的配置resultdb 是一个db,每个爬虫的结果分别是不同的集合。而我想把这些结果保存…

软的没边 2022-09-02 00:15:17 11 0

单机版的 pyspider工程 部署到 Pass平台上,能运行起来么?

手上现在用 pyspider 框架在做个爬虫项目,现在只是在单机上实现了爬取。请问: 单机版的 pyspider工程 可以部署到 Paas平台上么?能运行起来么? 烦…

生生不灭 2022-09-02 00:11:50 9 0

linux pyspider 任务管理和在线编辑运行是用什么库做的?

现在我想非常想要pyspider的定时任务管理和在线脚本编写运行的功能,不需要使用到它的爬虫功能,请问pyspider中能够抽离出这样的功能么?具体要怎么做…

篱下浅笙歌 2022-09-02 00:11:47 7 0

在Ubuntu14.01环境下安装pyspider报错

使用pip install pyspider命令来安装,结果出现报错。二进制依赖包夜正常安装了。异常如图所示 我是用的虚拟机安装的Ubuntu14.04的 …

狼性发作 2022-09-01 23:59:25 8 0

关于pyspider(Docker)的各个组成部分

老大,我看这个文档--Running pyspider with Docker,有个问题不太明白。 如果只是想搭建个数据库+pyspider的这种组合,是不是下面这样就可以了 # my…

想你只要分分秒秒 2022-09-01 23:45:13 6 0

linux pyspider 报错 phantomjs is not enabled

如题,但是phantomjs装好了而且进程启动了,但是在程序里面就会报错。请大神看下为啥…

℡寂寞咖啡 2022-09-01 23:44:47 7 0

关于python3下pyspider的self.crawl()对URL的中文编码

默认情况下url里的中文会被自动按utf8编码了,请问如何让它按gb2312编码呢…

橘香 2022-09-01 23:41:22 7 0

pyspider 模拟翻页

最近开始学,遇到很多网站的数据翻页都是js控制的,有没有这方面的例子,请大家给个。比如拉钩网怎么翻页…

若有似无的小暗淡 2022-09-01 23:38:40 8 0

pyspider 里 pyquery的 map方法 映射的返回值 无效导致单页能调试通,整体采集不到数据?

昨天用 pyspider 采集 汽车之家网 的 汽车详情页数据,因为他一条记录是table 中的某一列,所以需要用到遍历td,索引取当前列。找了半天 没实现jq的 …

会傲 2022-09-01 23:32:07 25 0

XMLSyntaxError

这个问题不知道是lxml的问题还是哪的问题,网上搜了下,没有任何头绪。 http://demo.pyspider.org/debug/test_XMLSyntaxError 只填写了on_start函数…

夜吻♂芭芘 2022-09-01 23:28:19 6 0

pyspider +mongodb 部署有问题

如题 pyspider -c config.json 后报错: [W 151225 17:29:08 run:398] phantomjs not found, continue running without it. [I 151225 17:29:10 resu…

凡尘雨 2022-09-01 23:26:30 14 0

pyspider win7 connect to scheduler rpc error:

新手在本地运行pyspider 在 UI 里面 创建project,但是执行的时候老是报: connect to scheduler rpc error: error(10061, '') 问了下有些人说是要装…

夕嗳→ 2022-09-01 23:22:29 8 0

成功安装pyspider以后,本地使用就会出现错误

连最基本的例子都运行不了···自己写的爬虫感觉不好,应付了作业以后想学一个爬虫框架 python3.4 用pip3命令安装了pyspider以后,可以登录网络UI但是…

時窥 2022-09-01 23:22:26 16 0
更多

推荐作者

謌踐踏愛綪

文章 0 评论 0

开始看清了

文章 0 评论 0

高速公鹿

文章 0 评论 0

alipaysp_PLnULTzf66

文章 0 评论 0

热情消退

文章 0 评论 0

白色月光

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文