如何存档整个网站以供离线查看？

发布于 2024-07-13 16:39:42 字数 374 浏览 4 评论 0原文

事实上，我们已经多次为客户刻录了我们的 asp.net 网站的静态/存档副本。到目前为止，我们一直使用 WebZip，但我们遇到了无数的崩溃问题，下载的页面无法正确重新链接，（

我们基本上需要一个应用程序来抓取和下载 ASP.NET 网站上所有内容的静态副本（页面、图像、文档、CSS 等），然后处理下载的页面，以便可以在没有互联网连接的情况下在本地浏览它们摆脱链接中的绝对网址等）。白痴证明越多越好。这似乎是一个非常常见且（相对）简单的过程，但我尝试了一些其他应用程序，但并没有留下深刻的印象

有人有他们推荐的存档软件吗？有人可以分享一个非常简单的过程吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

同尘 2024-07-20 16:39:42

您可以使用 wget：

wget -m -k -K -E http://url/of/web/site

You could use wget:

wget -m -k -K -E http://url/of/web/site

回复收藏 0 原文

娇纵 2024-07-20 16:39:42

在 Windows 中，您可以查看 HTTrack。它是非常可配置的，允许您设置下载速度。但您也可以将其指向一个网站并运行它，而无需任何配置。

根据我的经验，它是一个非常好的工具并且效果很好。我喜欢 HTTrack 的一些特点是：

开源许可证
恢复停止的下载
可以更新现有存档
您可以将其配置为下载时不主动，这样就不会浪费您的带宽和站点的带宽。

回复收藏 0 原文

偷得浮生 2024-07-20 16:39:42

Wayback Machine Downloader 作者：hartator 简单且快速。

通过 Ruby 安装，然后使用 Internet Archive 中的所需域和可选时间戳运行。

sudo gem install wayback_machine_downloader
mkdir example
cd example
wayback_machine_downloader http://example.com --timestamp 19700101000000

The Wayback Machine Downloader by hartator is simple and fast.

Install via Ruby, then run with the desired domain and optional timestamp from the Internet Archive.

sudo gem install wayback_machine_downloader
mkdir example
cd example
wayback_machine_downloader http://example.com --timestamp 19700101000000

回复收藏 0 原文

风吹雪碎 2024-07-20 16:39:42

我在 OSX 和 Windows 上的 WebCopier。

回复收藏 0 原文

玉环 2024-07-20 16:39:42

wget -r -k

...并研究其余选项。我希望您遵循以下准则：http://www.w3.org /Protocols/rfc2616/rfc2616-sec9.html 因此，您的所有资源对于 GET 请求都是安全的。

回复收藏 0 原文

送舟行 2024-07-20 16:39:42

我只是使用：wget -m。

回复收藏 0 原文

佞臣 2024-07-20 16:39:42

如果您的客户因合规性问题而存档，您希望确保内容可以经过身份验证。列出的选项适合简单查看，但在法律上不可接受。在这种情况下，您正在寻找时间戳和数字签名。如果你自己做的话就复杂得多。我建议使用 PageFreezer 等服务。

回复收藏 0 原文

茶色山野 2024-07-20 16:39:42

对于 OS X 用户，我发现此处找到的 siteucker 应用程序运行良好，无需配置任何内容，只需配置深度即可遵循链接。

回复收藏 0 原文

诗酒趁年少 2024-07-20 16:39:42

我已经使用 HTTrack 好几年了。它可以很好地处理所有页面间链接等。我唯一的抱怨是我还没有找到一个很好的方法来将其限制在子站点上。例如，如果我想要存档一个网站 www.foo.com/steve，它可能会跟踪 www.foo.com/rowe 的链接并对其进行存档。否则就太好了。高度可配置且可靠。

回复收藏 0 原文

~没有更多了~