如何使用Python在Wikipedia页面上获取页面创建日期?
我有一个问题,如何在表中获取特定文本。在此示例中,Wikipedia页面上的页面创建日期。例如,在此链接 中= info 我正在使用BeautifulSoup,但是我仍然…
FastText预训练的模型
有谁知道此处可用的经过培训的FastText型号 https:/ /docs/en/pretained-vectors.html 使用新的常见爬网或Wikipedia数据更新?还是现有的可下载几岁…
了解Wikidata日期属性的日期精度
Wikidata API将基于日期的字段作为Datavalue $ type ==“ Time”。例如,考虑哈佛大学的启动日期(属性值== p571): $mainsnak $mainsnak$snaktype […
Wikipedia API从列表中的每个页面中获取图像和信息
我一直在尝试从此列表中获取所有数据 https://en.wikipedia.orgg/ Wiki/类别:Fungi_of_canada 。这样它将从每种蘑菇中获取图像和信息作为JSON。但是…
Wikipedia api-对于多个标题生成ID的链接
我可以做两件事: 使用发电机,我可以请求以特定标题的ID检索链接: https://en.wikipedia.org/wikipedia.org/w/api.phpi.phpi.phpiaction.php? = k…
MediaWiki API-如何解析包含LUA模板的Wikitext?
我正在使用wikipedia api( https:// https://wwwwwww.mediawiki.org/wiki/wiki/api/api: parsing_wikitext )以Wikitext格式获取Wikipedia页面的…
在Wikipedia锚文本中刮擦标题时,如何忽略Infobox?
我试图在Wikipedia页面上刮擦前20个链接,但我想忽略右侧的Infobox。它具有“表”标签。这是我到目前为止所拥有的,任何帮助将不胜感激。 import requ…
限制结果,从函数内的循环到10个结果-Python
我有以下代码,该代码遵循随机的Wikipedia链接和文章标题。我试图将其限制为10个结果,而不是无限的结果,但我发现很难做到。有人可以帮忙吗? import…
从Google电子表格中获取Wikipedia的特定信息(不是整个桌子)
我有一个来自Wikipedia的“ Lead Rolling演员”的桌子,我想在每个演员的出生日期,活跃的日期等日期中添加一些列。 主角滚动演员 这是我第一次使用im…
如何从< p>刮擦Wikipedia文本没有ID或课程?
我正在抓取Wikipedia文本,但是< p> 没有任何类或ID: import requests as r from bs4 import BeautifulSoup as bs url=r.get("https://en.wi…
Wikipediaapi和特殊:随机:
我在Python上使用Wikipedia-api(也称为Wikipediaapi)。这是我使用的以下代码: import wikipediaapi wiki_wiki = wikipediaapi.Wikipedia('en') pag…
Python模块Wikipedia产生错误的答案
代码 QUESTION=input("") #Albert Einstein RESULTS = wikipedia.search(str(QUESTION))#['einstein family', 'hans albert einstein', 'albert einst…
从python那里获取Wikipedia的所有标题
我需要从意大利维基百科获取所有标题。我已经写了这个代码: import requests S = requests.Session() URL = "https://it.wikipedia.org/w/api.php" P…
使用 SPARQL 检索 Wikidata Item Wiki url
我正在使用这种方法来检索维基百科使用 Sparql 的多种语言的 Wikidata 项目的 url: SELECT ?item ?en ?url_en ?es WHERE { { ?item wdt:P31 wd:Q6256…