维基百科:跨多种语言的页面

发布于 2024-09-18 19:59:42 字数 149 浏览 4 评论 0原文

我想在我的项目中使用维基百科转储。我的项目需要以下信息。

  1. 对于维基百科条目,我想知道该页面包含哪种其他语言?
  2. 我想要 csv 或其他常见格式的可下载数据。

有没有办法获取这些数据?

谢谢 巴拉

I want to use wikipedia dump for my project. The below information is required for my project.

  1. For an wikipedia entry, I want to know which other language contain the page?
  2. I want an downloadable data in csv or other common format.

Is there a way to get this data?

Thanks
Bala

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

迷荒 2024-09-25 19:59:43

维基媒体基金会提供其所有项目的 XML 转储,包括英语维基百科。

解析英语维基文章的跨语言链接相当简单:此类链接的语法为 [[language_code:其他语言维基百科文章的名称]],其中 language_code 通常为 2 或 3字母代码(例如克林贡语的 tlh),基于 ISO 标准,但少数例外除外,例如简单英语的 simple

The Wikimedia foundation provides XML dumps of all of its projects, including the English language Wikipedia.

Parsing an English-language wiki article for inter-language links is fairly easy: the syntax for such links are [[language_code:Name of other language Wikipedia article]], where language_code is usually a two or three letter code (such as tlh for Klingon), based on an ISO standard except for a few exceptions, such as simple for Simple English.

温柔少女心 2024-09-25 19:59:43

维基媒体在 download.wikimedia.org 上提供不同格式的维基百科转储。

Wikimedia provides dumps of Wikipedia in different formats at download.wikimedia.org.

金橙橙 2024-09-25 19:59:43

即使这个问题很旧,我也会回答这个问题,因为事情已经发生了变化:现在有了 Wikidata

所有互连都已从维基百科文章中删除,现在维基数据托管了所有内容:您可以检查某个项目(例如,Q42“Douglas Adams”)和“链接到此项目的维基百科页面”部分将为您提供所有不同维基百科的附加链接

您可以在这里找到 Wikidata API,或者您也可以使用 Special:Export 页面用于检索 XML 中的文章。

I will answer this question even if it's old because things have changed: now there's Wikidata.

All the interlinks have been eliminated from Wikipedia articles, and now Wikidata hosts them all: you can check an Item (for example, Q42 "Douglas Adams") and the "Wikipedia pages linked to this item" section will provide you with the sitelinks to all different Wikipedias.

Here you can find Wikidata API, or you can use the Special:Export page to retrieve the article(s) in XML.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文