获取至少包含一个附加链接的所有项目的维基数据附加链接计数
有没有一种简单的方法来获取所有维基数据项的附加链接计数数据?我想使用这些数据来帮助对维基数据项目的可能文本实体链接进行排名,
我实际上只对至少具有一个的项目的计数感兴趣(例如,wikibase:sitelinks 值> 0)。根据我所看到的统计,只有大约 1/3 的维基数据项目至少有一个附加链接。
我不确定 wikibase:sitelinks 是否包含在标准 WIkidata 转储中。我可以尝试使用 OFFSET 和 LIMIT 进行 SPARQL 查询,但我怀疑该方法能否完成。
Is there a simple way to get the sitelinks count data for all Wikidata items? I want to use the data to help rank possible text entity links to Wikidata items
I'm really only interested in counts for items that have at least one (e.g., wikibase:sitelinks value that's >0). According to statistics I've seen, only about 1/3 of Wikidata items have at least one sitelink.
I'm not sure if wikibase:sitelinks is included in the standard WIkidata dump. I could try a SPARQL query with an OFFSET and LIMIT, but I doubt that the approach would work to completion.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
查询示例:“维基数据中的猫拥有最多的附加链接”:
您对此感兴趣吗?
如果您愿意,Wikidata 在此处提供了有关在 SPARQL 中查询附加链接的更多精彩示例:
https: //www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries#Working_with_sitelinks
Example query: "Cats in Wikidata with most sitelinks" here:
Is this interesting for you?
If you want, Wikidata has more nice examples about querying sitelinks in SPARQL here:
https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries#Working_with_sitelinks