如何获取“所有带有前缀的页面”的结果使用维基百科 API?
我希望使用 Wikipedia api 提取此页面的结果:
http://en.wikipedia.org /wiki/Special:PrefixIndex
当搜索“某物”时,例如:
http://en.wikipedia.org/w /index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4
然后,我想访问每个结果页面并提取它们的信息。
我可以使用什么 api 调用?
I wish to use Wikipedia api to extract the result of this page:
http://en.wikipedia.org/wiki/Special:PrefixIndex
When searching "something" on it, for example this:
http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4
Then, I would like to access each of the resulting pages and extract their information.
What api call might I use?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以使用
list=allpages
并指定apprefix
。例如:http://en.wikipedia.org/w/api.php?format=xml&action=query&list=allpages&apprefix=tal&aplimit=max
此查询将为您提供以
tal
开头的每篇文章的 ID 和标题。如果您想获取有关每个页面的更多信息,可以使用此列表作为生成器:<一个href="http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info" rel="nofollow">http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info
您可以给
prop
参数赋予不同的值来获取页面的不同信息。You can use
list=allpages
and specifyapprefix
. For example:http://en.wikipedia.org/w/api.php?format=xml&action=query&list=allpages&apprefix=tal&aplimit=max
This query will give you the id and title of each article that starts with
tal
. If you want to get more information about each page, you can use this list as a generator:http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info
You can give different values to the
prop
parameter to get different information about the page.