如何用爬虫爬去整个网站

发布于 2022-09-06 08:24:18 字数 82 浏览 21 评论 0

如题,如果我要爬取一个仅仅只是提供文档说明的网站,但它经常不稳定,所以我想把它整站下载下来方便以后查看。(注:希望提供下思路和方法,就是想顺便学习下)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

亢潮 2022-09-13 08:24:18
wget -r -p -np -k http://example.com/index.html

-r 递归
-p 下载页面相关的其它内容
-np 不追溯至父级
-k 页面内链接转换为相对链接

扎心 2022-09-13 08:24:18

直接用 浏览器离线模式吧,没有必要写爬虫

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文