本章介绍了网络爬虫,然后开发了一个能够在后续章节中复用的成熟爬虫。此外,我们还介绍了一些外部工具和模块的使用方法,用于了解网站、用户代理、网站地图、爬取延时以及各种爬取策略。
下一章中,我们将讨论如何从已爬取到的网页中获取数据。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
发布评论