文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
13.6 本章小结
本章学习了Scrapy爬虫如何使用代理进行爬取,首先介绍了两种设置代理的方法:
使用下载中间件HttpProxyMiddleware(自动)。
在构造Request对象时通过meta参数设置(手动)。
前者使用简单,只需通过环境变量配置即可;后者可在某些特殊场景下使用。我们以如何使用多个代理进行了举例,随后讲解了在网络上获取免费代理的方法,并利用获取的免费代理实现了一个随机代理中间件。最后,运用本章所学的知识完成一个实战项目,使用代理爬取了豆瓣网中的电影信息。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论