导入维基百科的 xml.bz2 选项

发布于 2025-01-01 06:45:21 字数 154 浏览 2 评论 0原文

我想到了编写一个可以使用 XML 并将其插入数据库的 Java 程序的可能性。我提取了压缩的维基百科页面文件，因此我现在将其保存在 xml 中，而不仅仅是 xml.bz2 中。我查看了维基百科的网站，但没有成功。找不到东西。我想这不应该是一个非常困难的过程，它应该很简单，这就是我问你的原因:)

需要登录才能够评论，你可以免费注册一个本站的账号。

埋情葬爱 2025-01-08 06:45:21

.bz2 后缀表示 bzip2 压缩。如果您使用的是 Linux 或其他 Unixish 操作系统，您可能已经安装了 bzip2 解压缩器；如果您使用的是 Windows，则可以此处下载一个。

请注意，有些 Java 库可让您直接读取 bzip2 压缩的流，而无需外部解压缩器。其中之一可以在此处找到。

编辑：等等，我想我误解了你的问题。您似乎已经成功解压缩了 XML 转储，现在您想知道如何处理它。在这种情况下，您可能需要查看 mwdumper。

~没有更多了~

暂无简介

文章

26 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0