有没有办法批量获取维基百科图像元数据?
例如,此图像网址 (http://en.wikipedia.org/wiki/File: NewYork1777MapRestoredSmall.png )有关于其描述的信息:“英语:纽约州和新泽西州的省份地图”
我看了一下http://en.wikipedia.org/w/api.php。它非常适合一次允许多个查询,但它只有以下字段: 时间戳、用户、用户 ID、评论、解析评论、url、大小、维度、sha1、mime、thumbmime、元数据、存档名称、位深度
无描述字段。这是解析这个html页面的唯一方法吗?
For example, this image url (http://en.wikipedia.org/wiki/File:NewYork1777MapRestoredSmall.png ) has information about its Description: "English: Map of the provinces of New York and New Jersey"
I took a look at http://en.wikipedia.org/w/api.php. It's great for allowing multiple queries at once but it only had fields for:timestamp, user, userid, comment, parsedcomment, url, size, dimensions, sha1, mime, thumbmime, metadata, archivename, bitdepth
No description field. Is the only way to parse this html page?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
看起来 comment 或 parsedcomment 可能会给你你想要的东西。 comment 似乎返回摘要部分的 wiki 标记,而 parsedcomment 似乎返回 HTML。
It looks like comment or parsedcomment might give you what you want. comment seems to return the wiki markup of the Summary section, while parsedcomment seems to return the HTML.