pyspider爬虫

发布于 2021-12-01 08:29:28 字数 166 浏览 906 评论 3

@万里谁能驯 你好,想跟你请教个问题:pyspider在爬取网页的时候每次重启都继续上一次的接着爬,怎么设置让它重新开始?,谢谢!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

裸钻 2021-12-06 12:02:13

这篇文章能帮到你,菜鸟学Python爬虫系列之十使用PySpider框架

http://log4geek.cc/2017/03/%e8%8f%9c%e9%b8%9f%e5%ad%a6%e7%88%ac%e8%99%ab%e7%b3%bb%e5%88%97%e4%b9%8b%e5%8d%81%e4%bd%bf%e7%94%a8pyspider%e6%a1%86%e6%9e%b6/

囚你心 2021-12-06 12:01:59

推荐大家使用神箭手云爬虫(http://www.shenjianshou.cn),里面有不少已经写好可以直接运行的爬虫,包括爬取微信啊,优酷啊,知乎之类的。

如果是开发者也可以直接在后台使用JavaScript编写爬虫,自带图片云托管、代理ip、验证码识别、爬取异步加载的数据等高级功能,省去了很多开发过程中会遇到的问题。爬虫编写和运行都在云上进行,十分方便。

官方demo源码地址:https://github.com/ShenJianShou/crawler_samples,偷偷告诉你,官方会不断放更多demo源码进去哦!

像你 2021-12-06 04:39:55

我不知道,pyspider用的不熟。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文