wikipedia

wikipedia

文章 1 浏览 82

从默认的 python xml.sax 转换为 lxml sax 接口

我希望加快维基百科部分内容(大约 5GB)的解析速度。现在我正在使用一个使用 python sax 接口的脚本,而 lxml 似乎是一个直接的加速解决方案。 但是…

不念旧人 2025-01-03 01:50:27 4 0

使用 GeoNames Java API 检索给定维基百科文章标题的坐标

假设我有维基百科文章的标题,例如费城,并且我想要那个地方的坐标。我不想从维基百科获取此内容,因为看起来我必须检索整篇文章。我不想只是松散地查…

在风中等你 2025-01-02 21:28:40 3 0

jsoup - 从维基百科文章中提取文本

我正在编写一些 Java 代码,以便使用维基百科的文本实现 NLP 任务。如何使用 JSoup 提取维基百科文章的所有文本(例如 http:// 中的所有文本en.wikipe…

眉黛浅 2025-01-02 11:06:40 4 0

按类别导出维基百科选项?

我知道我可以完整下载维基百科。但我想知道有没有办法按类别下载?他们有特殊导出页面,但写了一个类别(例如文化)添加了儿童页面和另一组类别,因此…

旧街凉风 2025-01-01 09:13:21 3 0

导入维基百科的 xml.bz2 选项

我想到了编写一个可以使用 XML 并将其插入数据库的 Java 程序的可能性。我提取了压缩的维基百科页面文件,因此我现在将其保存在 xml 中,而不仅仅是 x…

幽梦紫曦~ 2025-01-01 06:45:21 2 0

如何获取“所有带有前缀的页面”的结果使用维基百科 API?

我希望使用 Wikipedia api 提取此页面的结果: http://en.wikipedia.org /wiki/Special:PrefixIndex 当搜索“某物”时,例如: http://en.wikipedia.o…

扎心 2024-12-29 16:16:54 7 0

使用 DBpedia 和 SPARQL 获取所有定义的颜色

如何查询 DBpedia 以获取 Wikipedia 中所有颜色值的名称和十六进制代码(即 color 信息框的任何使用)? Spring Green 文章使用 color 模板,如下所示…

勿忘心安 2024-12-29 08:05:08 4 0

mwlib 列表文章

我正在尝试使用 mwlib (半官方 Python 库)来解析维基百科并进行一些文本挖掘。到目前为止,我还没有找到任何官方文档,并且不得不依赖谷歌、奇怪的…

无边思念无边月 2024-12-28 12:43:29 2 0

Wikipedia list=search REST API:如何检索匹配文章的 Url

我正在研究维基百科 REST API,但我无法找到正确的选项来获取搜索查询的 URL。 这是请求的 URL: http://it.wikipedia.org/w/api.php?action=query&li…

魂归处 2024-12-28 01:37:15 5 0

如何获取复杂的维基百科模板的结果?

这是一个有点难以理解的问题,但我会尽力解释它。首先,让我展示一个示例页面: http://en.wikipedia.org/wiki/African_bush_elephant 这是一个维基百…

鸩远一方 2024-12-27 17:39:39 3 0

在 PHP 中解析 Wikipedia 标记的最佳方法是什么?

我正在尝试以结构化的方式解析特定的维基百科内容。这是一个示例页面: http://en.wikipedia.org/wiki/Polar_bear 我是取得了一些成功。我可以检测到…

我不是你的备胎 2024-12-22 21:07:59 5 0

使用正则表达式从Python中的字符串中提取括号

如果我们只知道“模板”,我如何从这个字符串中提取 {{template|{{template2}}|other params}} : {{template0}} {{template|{{template2}}|other par…

↙厌世 2024-12-22 02:51:11 6 0

是否有专门用于检索内容摘要的维基百科 API?

我只需要检索维基百科页面的第一段。 内容必须采用 HTML 格式,可以在我的网站上显示(所以不 BBCode,或维基百科特殊代码!)…

淡淡绿茶香 2024-12-21 22:48:13 7 0

如何使用搜索字符串搜索维基百科并获取数据,在我的应用程序中解析和显示......?

全部 我在谷歌中搜索过这个,但我对很多网站感到困惑,这些网站没有找到明确的逐步程序。 如果有人有想法,所有需要做的事情是什么。请指导我...! 提…

下雨或天晴 2024-12-21 21:20:54 6 0

使用 JQuery 获取维基百科信息框内容

我希望使用 JQuery 来提取包含公司详细信息的维基百科信息框的内容。 我想我已经快到了,但我只是无法完成最后一步 var searchTerm="toyota"; var url…

勿忘心安 2024-12-21 19:33:40 5 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文