检索维基百科页面的另一种语言
任务:我们有维基百科英文页面,需要检索俄语的相同页面地址。
我知道语义网解决方案 - 使用 DbPedia 的简单查询,但我很好奇是否有传统的解决方案。我在 semanticoverflow.com 中提出了同样的问题,其中Toby Inkster 建议解析 http://en.wikipedia.org/wiki/Colugo?action= raw 结果(底部有其他语言链接),但是这种方式效率太低了。还有其他方法吗?或者 DbPedia 是唯一真正的选择?
Task: We have Wikipedia English page and need to retrieve the same page address in Russian.
I know the Semantic Web solution - use simple query to DbPedia, but I am curious whether there are traditional solutions. I have asked the same question in semanticoverflow.com where Toby Inkster suggested to parse http://en.wikipedia.org/wiki/Colugo?action=raw results (there are other languages links in the bottom), but this way is too inefficient. Are there any other ways or DbPedia is the one real option?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
维基百科有一个扩展的API,它可以提供语言链接信息等。在这种特殊情况下,您正在寻找
api.php?action=query&prop=langlinks&titles=...
。 请参见此处的示例。Wikipedia has an extensive API, which can provide language links information among others. In this particular case, you're looking for
api.php?action=query&prop=langlinks&titles=...
. See here for example.有时,在查找页面的日语 (ja) 标题等效项时,https://en.wikipedia.org/ wiki/Aframomum_corrorima
[out]:
然后你会发现 https://ja.wikipedia.org/w/index.php?title=kororima 未写入但 wikidata API 能够找到正确的实体翻译。
要提取所有可能的链接,请执行以下操作:
[out]:
Sometimes, when finding the Japanese (ja) title equivalence for page, https://en.wikipedia.org/wiki/Aframomum_corrorima
[out]:
Then you'll find that the https://ja.wikipedia.org/w/index.php?title=コロリマ isn't written yet but the wikidata API is able to find the right entity translation.
To extract all the possible links, do something like:
[out]: