使用 wget 仅以纯 xhtml 格式下载 dokuwiki 页面

发布于 2024-11-09 12:07:54 字数 729 浏览 3 评论 0原文

我目前正在修改offline-dokuwiki[1] shell 脚本,以获取应用程序的最新文档,以便自动嵌入到该应用程序的实例中。这工作得很好,除了在当前的形式下,它获取每个页面的三个版本:

  1. 包括页眉和页脚的完整页面
  2. 仅不含页眉和页脚的内容
  3. 我实际上只对原始 wiki 语法

感兴趣 2. 这是从主页由 中的 html 标记组成,如下所示:

<link rel="alternate" type="text/html" title="Plain HTML" 
href="/dokuwiki/doku.php?do=export_xhtml&amp;id=documentation:index" /> 

并且与主要 wiki 页面的 url 相同,只是它们包含查询字符串中的“do=export_xhtml”。有没有办法指示 wget 仅下载这些版本或自动将“&do=export_xhtml”添加到其后面的任何链接的末尾?如果是这样,这将是一个很大的帮助。

[1] http://www.dokuwiki.org/tips:offline-dokuwiki.sh< /a> (作者:samlt)

I'm currently modifying the offline-dokuwiki[1] shell script to get the latest documentation for an application for automatically embedding within instances of that application. This works quite well except in its current form it grabs three versions of each page:

  1. The full page including header and footer
  2. Just the content without header and footer
  3. The raw wiki syntax

I'm only actually interested in 2. This is linked to from the main pages by a html <link> tag in the <head>, like so:

<link rel="alternate" type="text/html" title="Plain HTML" 
href="/dokuwiki/doku.php?do=export_xhtml&id=documentation:index" /> 

and is the same url as the main wiki pages only they contain 'do=export_xhtml' in the querystring. Is there a way of instructing wget to only download these versions or to automatically add '&do=export_xhtml' to the end of any links it follows? If so this would be a great help.

[1] http://www.dokuwiki.org/tips:offline-dokuwiki.sh (author: samlt)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

余生共白头 2024-11-16 12:07:54

DokuWiki 也接受 do 参数作为 HTTP 标头。您可以使用参数 --header "X-DokuWiki-Do: export_xhtml" 运行 wget

DokuWiki accepts the do parameter as HTTP header as well. You could run wget with the parameter --header "X-DokuWiki-Do: export_xhtml"

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文