如何获取维基百科条目的模板类型

发布于 2024-10-16 04:08:23 字数 699 浏览 4 评论 0原文

我需要找出维基百科页面条目的模板类型。到目前为止,我一直依赖于解析维基百科查询的结果,这在一定程度上是有效的。

例如,如果我搜索 Joel Spolsky,我可以正则表达式匹配'infobox'并发现此页面引用

但麻烦的是,维基百科模板类型没有一致的命名方案,并且模板名称中通常不使用“infobox”。

例如,如果我搜索 匹兹堡钢人队 我无法可靠地找到提取NFL 球队 结果中的模板。

有人知道查询维基百科页面模板类型的方法吗?谢谢 :)

I need to find out the template type of a Wikipedia page entry. Up to this point, I've relied on parsing the results from a query to Wikipedia, which works to a point.

For instance, if I search for
Joel Spolsky, I can regex match 'infobox' and find out that this page refers to Infobox Person.

But the trouble is, there is no consistent naming scheme for Wikipedia template types, and 'infobox' is often not used in the name of the template.

For instance, if I search for the Pittsburgh Steelers I can't reliably find out a way to extract the NFL team template from the results.

Is anyone aware of a way to query the template type of a Wikipedia page? Thanks :)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

初见终念 2024-10-23 04:08:23

最简单的方法是查看页面的类别而不是模板。例如,Joel Spolsky 有“活着的人”类别,匹兹堡钢人队有“国家橄榄球联盟球队”类别。

The easiest way would be to look at the categories of the page instead of the templates. For example, Joel Spolsky has the category "Living people", and Pittsburgh Steelers has the category "National Football League teams".

想挽留 2024-10-23 04:08:23

也许 DBpedia 可以提供帮助。 DBpedia 提取来自 Wikipedia 的结构化数据,提供下载并将其存储在可公开访问的数据库中。例如,在 http://dbpedia.org/sparql 尝试以下查询:

select distinct ?t where {
  ?t a <http://dbpedia.org/ontology/AmericanFootballTeam> .
}

它返回所有已知的美国橄榄球队到 DBpedia,采用 RDF 格式。现在几乎所有语言都有 RDF API,因此获取所需数据应该相对容易。

Maybe DBpedia can help. DBpedia etxracts structured data from Wikipedia, offers it for download and stores it in a publicly accessible database. For example, try the following query at http://dbpedia.org/sparql :

select distinct ?t where {
  ?t a <http://dbpedia.org/ontology/AmericanFootballTeam> .
}

It returns all American football teams known to DBpedia, in RDF format. Almost all languages have a RDF API nowadays, so it should be relatively easy to get the data you need.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文