如何获取维基百科上文章的完整更改历史记录？

发布于 2024-09-11 17:10:02 字数 419 浏览 5 评论 0原文

我想要一种方法来下载维基百科上热门文章的历史记录中的每个页面的内容。换句话说，我想获得一篇文章的每次编辑的完整内容。我该怎么做呢？

有没有一种简单的方法可以使用 Wikipedia API 来做到这一点？我看了看，没有发现任何简单的解决方案。我还研究了 PyWikipedia Bot 页面上的脚本 (http://botwiki.sno.cc/w/index.php?title=Template:Script&oldid=3813）并没有找到任何有用的东西。在 Python 或 Java 中执行此操作的一些简单方法将是最好的，但我愿意接受任何可以获取数据的简单解决方案。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

呢古 2024-09-18 17:10:02

为此有多种选择。您可以使用 Special:Export 特殊页面来获取页面历史记录的 XML 流。或者，您也可以使用 /w/api.php 下的 API。使用 action=query&title=$TITLE&prop=revisions&rvprop=timestamp|user|content 等来获取历史记录。
Pywikipedia 提供了一个接口，但我不知道如何调用它。 Python 的替代库 mwclient 也通过 site.pages[page_title] 提供此功能。修订（）