有人知道 yarowsky 算法的实现吗?
我想使用 yarowsky 算法在大文本中查找搭配。 我在以下链接中阅读了有关此算法的信息: wikipedia 和 Yarowsky 谷歌图书和 yarowsky 我想知道是否有 y…
Nltk 中的 WordNetLemmatizer 可以词干吗?
我想使用 Wordnet 查找词干。 wordnet 有词干提取功能吗? 我使用此导入进行词干提取,但它没有按预期工作。 from nltk.stem.wordnet import WordNetL…
使用 Python 进行实时文本处理
使用 Python 进行实时文本处理。例如,考虑这句话, I am going to schol today 我想执行以下操作(实时): 1) tokenize 2) check spellings 3) stem…
有人听说 NLTK 3.0 何时发布吗?
该网站 http://www.nltk.org 以非常含糊的方式表示 2011 年中期。我想开始使用 NLTK,但是我已经使用 Python 3.x 做了相当多的工作,我不想为了使用它…
nltk 语言模型(ngram)根据上下文计算单词的概率
我正在使用Python和NLTK构建语言模型,如下所示: from nltk.corpus import brown from nltk.probability import LidstoneProbDist, WittenBellProbDi…
是否可以增加 python 进程使用的 RAM 量
我正在具有 64GB RAM 的 Windows 服务器上运行分类/特征提取任务,不知何故,python 认为我内存不足: misiti@fff /cygdrive/c/NaiveBayes $ python r…
使用 NLTK 的 FreqDist
我正在尝试使用 Python 获取一组文档的频率分布。我的代码由于某种原因无法工作并产生此错误: Traceback (most recent call last): File "C:\Documen…
使用 python nltk 查找两个网页之间的相似性?
我想知道两个网页是否相似。有人可以建议带有 wordnet 相似性函数的 python nltk 是否有帮助以及如何帮助?在这种情况下使用的最佳相似度函数是什么?…