获取至少包含一个附加链接的所有项目的维基数据附加链接计数

发布于 2025-01-16 04:35:41 字数 267 浏览 1 评论 0原文

有没有一种简单的方法来获取所有维基数据项的附加链接计数数据?我想使用这些数据来帮助对维基数据项目的可能文本实体链接进行排名,

我实际上只对至少具有一个的项目的计数感兴趣(例如,wikibase:sitelinks 值> 0)。根据我所看到的统计,只有大约 1/3 的维基数据项目至少有一个附加链接。

我不确定 wikibase:sitelinks 是否包含在标准 WIkidata 转储中。我可以尝试使用 OFFSET 和 LIMIT 进行 SPARQL 查询,但我怀疑该方法能否完成。

Is there a simple way to get the sitelinks count data for all Wikidata items? I want to use the data to help rank possible text entity links to Wikidata items

I'm really only interested in counts for items that have at least one (e.g., wikibase:sitelinks value that's >0). According to statistics I've seen, only about 1/3 of Wikidata items have at least one sitelink.

I'm not sure if wikibase:sitelinks is included in the standard WIkidata dump. I could try a SPARQL query with an OFFSET and LIMIT, but I doubt that the approach would work to completion.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

眉黛浅 2025-01-23 04:35:42

查询示例:“维基数据中的猫拥有最多的附加链接”:

# 选择所有猫,按大多数维基媒体附加链接排序(包含计数和原始附加链接)
选择?项目
       ? 项目标签
       ( COUNT( ?sitelink ) AS ?sitelink_count )
       ( GROUP_CONCAT( ?sitelink ) AS $sitelinks_raw )
在哪里 {
  ?项目 wdt:P31 wd:Q146。 # 这是一只猫
  ?附加链接架构:关于?项目。 # 有关该项目的附加链接
                                # 使用我的语言或英语的标签
  服务维基库:标签{
     bd:serviceParam wikibase:语言“[AUTO_LANGUAGE],en”。
  }
}
分组依据?项目?项目标签
有 ( COUNT( ?sitelink ) > 3 )
按 DESC 排序( COUNT( ?sitelink ) )

<一href="https://query.wikidata.org/#%23%20select%20all%20Cats%2C%20ordered%20by%20most%20Wikimedia%20sitelinks%20%28with%20count%20a nd%20the%20raw%20sitelinks%29%0ASELECT%20%3Fitem%0A%20%20%20%20%20%20%20%3FitemLabel%0A%20%20%20%20%20%20%20% 28%20COUNT%28%20%3F坐elink%20%29%20AS%20%3Fsitelink_count%20%29%0A%20%20%20%20%20%20%20%28%20GROUP_CONCAT%28%20%3Fsitelink%20%29%20AS%20% 24sitelinks_ra w%20%29%0AWHERE%20%7B%0A%20%20%3Fitem%20wdt%3AP31%20wd%3AQ146.%20 %20%20%20%20%20%20%20%23%20it%27s%20a%20Cat%0A%20%20%3Fsitelink%20架构%3Aabout%20%3Fitem.%20%23%20sitelink%20about%20the%20item%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20 %20%20%20%20%20%20%20% 20%20%20%20%20%20%20%20%20%20%20%23%20label%20in%20my%20语言%2C%20or%20英语%0A%20%20SERVICE%20wikibase%3Alabel%20% 7B%0A%20%2 0%20%20%20bd%3AserviceParam%20wikibase%3Alanguage%20%22%5BAUTO_LANGUAGE%5D%2Cen%22.%0A%20%20%7D%0A%7D%0AGROUP%20BY%20%3Fitem%20%3Fi temLabel%0AHAVING%20%28%20COUNT%28%20%3Fsitelink%20%29%20%3E%203%20%29%0AORDER%20BY%20DESC%28%20COUNT%28%20%3Fsitelink%20%29% 20%29" rel="nofollow noreferrer">尝试在维基数据上查询

您对此感兴趣吗?

如果您愿意,Wikidata 在此处提供了有关在 SPARQL 中查询附加链接的更多精彩示例:

https: //www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries#Working_with_sitelinks

Example query: "Cats in Wikidata with most sitelinks" here:

# select all Cats, ordered by most Wikimedia sitelinks (with count and the raw sitelinks)
SELECT ?item
       ?itemLabel
       ( COUNT( ?sitelink ) AS ?sitelink_count )
       ( GROUP_CONCAT( ?sitelink ) AS $sitelinks_raw )
WHERE {
  ?item wdt:P31 wd:Q146.        # it's a Cat
  ?sitelink schema:about ?item. # sitelink about the item
                                # label in my language, or English
  SERVICE wikibase:label {
     bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en".
  }
}
GROUP BY ?item ?itemLabel
HAVING ( COUNT( ?sitelink ) > 3 )
ORDER BY DESC( COUNT( ?sitelink ) )

Try query on Wikidata

Is this interesting for you?

If you want, Wikidata has more nice examples about querying sitelinks in SPARQL here:

https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries#Working_with_sitelinks

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文