wikipedia

wikipedia

文章 1 浏览 78

cron 作业的应用程序引擎 DeadlineExceededError 和维基百科爬虫的任务队列

我正在尝试在谷歌应用程序引擎上构建一个维基百科链接爬虫。我想在数据存储中存储索引。但我遇到了 cron 作业和任务队列的 DeadlineExceededError 。 …

筱果果 2024-09-27 04:28:12 4 0

在 Lucene 中使用 WikipediaTokenizer 的示例

我想在 lucene 项目中使用 WikipediaTokenizer - http://lucene.apache.org/java/3_0_2/api/contrib-wikipedia/org/apache/lucene/wikipedia/analysis…

明明#如月 2024-09-26 23:18:13 4 0

人名消歧

我目前正在做一个关于人名消歧的项目。该项目背后的想法是,当有多个同名的人时,它将能够识别出正确的人。我为此使用了维基百科。我想根据一些标准数…

我爱人 2024-09-26 02:55:17 9 0

Java:使用 SAXParser 拆分大型 XML 文件

我正在尝试使用 java 的 SAXParser 将大型 XML 文件拆分为较小的文件(特别是维基百科转储,未压缩时约为 28GB)。 我有一个 Pagehandler 类,它扩展…

清引 2024-09-26 01:52:18 5 0

当请求缺少用户代理时,维基百科 API 给出 ​​HTTP 403

我在使用维基百科 API 时遇到问题。我使用这个 PHP 脚本: &lt?php $xmlDoc = new DOMDocument() $xmlDoc-&gtload("http://en.wikipedia.org/w/api.ph…

維他命╮ 2024-09-24 20:25:17 6 0

使用 NSScanner 获取维基百科文章摘要问题

我正在尝试获取一篇文章的摘要并将其作为字符串下载。这对于某些文章非常有用,但维基百科网站不一致。因此 NSScanner 经常失败,而它对于其他文章却…

倾城泪 2024-09-24 16:27:34 4 0

维基百科:跨多种语言的页面

我想在我的项目中使用维基百科转储。我的项目需要以下信息。 对于维基百科条目,我想知道该页面包含哪种其他语言? 我想要 csv 或其他常见格式的可下…

冷︶言冷语的世界 2024-09-18 19:59:42 8 0

想要最常用的英语单词

我想要最常用的英语单词。基本上,我正在处理维基百科文本,即使在删除停用词后,我仍会遇到很多单词。我尝试用谷歌搜索常用词,但得到了以下链接。 h…

梦太阳 2024-09-17 08:27:04 16 0

维基媒体页面到 Python 中的文本

我想将使用 API 提取的维基百科内容转换为纯文本。 有什么提示吗?…

嗼ふ静 2024-09-15 20:27:03 5 0

我在哪里可以找到网络上的原始文本转储?

我希望在我正在编写的程序中进行一些文本分析。我正在寻找原始形式的替代文本源,类似于维基百科转储 (download.wikimedia.com) 中提供的内容。 我宁…

原来是傀儡 2024-09-12 15:31:08 5 0

如何获取维基百科上文章的完整更改历史记录?

我想要一种方法来下载维基百科上热门文章的历史记录中的每个页面的内容。换句话说,我想获得一篇文章的每次编辑的完整内容。我该怎么做呢? 有没有一…

白馒头 2024-09-11 17:10:02 2 0

如何从维基百科获取Infobox数据?

如果我有某个页面的 URL,我如何使用 MediaWiki Web 服务获取右侧的信息框信息?…

别理我 2024-09-11 00:23:38 5 0

调车场:操作员缺少参数

我正在实施调车场算法。我无法检测到运算符是否缺少参数。 wikipedia 条目 在这个主题上非常糟糕,并且他们的代码在示例中也会崩溃以下。 例如,3 - (…

2024-09-10 19:12:36 5 0

使用jquery读取wikipedia url的内容,跨域网络调用

jQuery.ajax( { url:'http://en.wikipedia.org/wiki/Football', type:'get', dataType:'jsonp', success:function(data){alert(data)}, } 我想使用 j…

难忘№最初的完美 2024-09-07 02:40:58 8 0

list=alllinks 混淆

我正在做一个夏天的研究项目,我必须使用从维基百科获取一些数据,存储它,然后对其进行一些分析。我正在使用维基百科 API 来收集数据,并且我已经很…

疯狂的代价 2024-09-04 11:17:36 5 0
更多

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文