如何以编程方式保存网页?

发布于 2024-08-10 23:43:38 字数 138 浏览 7 评论 0原文

我想以编程方式保存网页。

我的意思不仅仅是保存 HTML。我还希望自动存储所有关联的文件(图像、CSS 文件、可能嵌入的 SWF 等),并希望重写本地浏览的链接。

预期用途是个人书签应用程序,其中缓存链接内容,以防原始副本被删除。

I would like to save a web page programmatically.

I don't mean merely save the HTML. I would also like automatically to store all associated files (images, CSS files, maybe embedded SWF, etc), and hopefully rewrite the links for local browsing.

The intended usage is a personal bookmarks application, in which link content is cached in case the original copy is taken down.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

最舍不得你 2024-08-17 23:43:38

看一下 wget,特别是 -p 标志

−p  −−page−requisites
This option causes Wget to download all the files
that are necessary to properly display
a givenHTML  page. Thisincludes such
things as inlined images, sounds, and
referenced stylesheets.

以下命令:

wget -p http://<site>/1.html

将下载 page.html以及它需要的所有文件。

Take a look at wget, specifically the -p flag

−p  −−page−requisites
This option causes Wget to download all the files
that are necessary to properly display
a givenHTML  page. Thisincludes such
things as inlined images, sounds, and
referenced stylesheets.

The following command:

wget -p http://<site>/1.html

Will download page.html and all files it requires.

就此别过 2024-08-17 23:43:38

在 Windows 上:您可以将 IE 作为 com 对象运行并提取所有内容。

另一方面,您可以获取 Mozilla 的源代码。

在 Java 中,Lobo

或者commons-httpclient,写很多代码。

On Windows: you can run IE as a com object and pull everything out.

On other thing, you can take the source of Mozilla.

In Java, Lobo.

Or commons-httpclient and write a lot of code.

梦开始←不甜 2024-08-17 23:43:38

您可以尝试 MHTML 格式(IE 使用的格式)。 http://en.wikipedia.org/wiki/MHTML

换句话说,您将每个对象(图像、CSS 等)下载到您的计算机,然后通过 Base64 将它们“嵌入”到单个文件中。

You could try the MHTML format (which is what IE uses). http://en.wikipedia.org/wiki/MHTML

In other words, you'd be downloading each object (image, css, etc.) to your computer, and then "embedding" them, via Base64, into a single file.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文