文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
8.5 本章小结
本章首先介绍了网络爬虫框架Scrapy,该框架拥有很多能够改善抓取网站效率的高级功能。然后介绍了Portia,它提供了生成Scrapy爬虫的可视化界面。最后我们试用了Scrapely,Portia正是使用该库根据给定模型自动化抓取网页的。
下一章中,我们将应用前面学到的这些技巧来抓取现实世界中的网站。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论