将 python 模块保留在内存中
我正在使用 python 自然语言工具包,其中有一个名为 pos_tag 的有用函数。您可以对从句子标记化的任何单词列表运行 nltk.pos_tag() ,它将返回包含句…
Python正则表达式nltk网站提取
您好,我以前从未处理过正则表达式,我正在尝试使用 Python 和 NLTK 预处理一些原始文本。 当我尝试使用以下方法标记文档时: tokens = nltk.regexp_t…
NLTK“生成”功能:如何取回返回的文本?
我是一个 Python 菜鸟,所以请耐心等待。 我正在尝试使用 NLTK 库,特别是“生成”函数。从文档来看,该函数只是打印其结果( http://nltk.googlecode…
NLTK 分块并遍历结果树
我正在使用 NLTK RegexpParser 从标记的标记中提取名词组和动词组。 如何遍历生成的树以仅查找 NP 或 V 组的块? from nltk.chunk import RegexpParse…
需要在Python中为语料库创建直方图
import nltk from nltk.book import * from nltk.corpus import brown corpus_text = brown.words() word_freq = FreqDist(corpus_text) word_hist = …
MALLET 与 NLTK 中的主题建模
我刚刚读了一篇关于如何使用 MALLET 进行主题建模的精彩文章,但我在网上找不到任何将 MALLET 与 NLTK 进行比较的内容,而我已经有一些经验了。 它们…
IronPython 2.7.1 beta 2 的外籍人士
我正在尝试让 NLTK 与 IronPython 2.7.1 一起使用。到目前为止,安装工作正常,但我尝试了一些示例代码,但缺少 expat 模块。有什么关于如何启动并运…
从 Wordnet 中查找与给定单词相隔固定编辑距离的单词
我正在使用 nltk 和 wordnet 编写拼写检查器,我有一些拼写错误的单词“belive”。我想要做的是从 wordnet 中找到与该给定单词的 leveshtein 编辑距离…
NLTK 找不到 Java 可执行文件
我使用的是NLTK的nltk.tag.stanford,它需要调用java可执行文件。 我将 JAVAHOME 设置为安装了 jdk 的 C:\Program Files\Java\jdk1.6.0_25 ,但是当运…
nltk.corpus.wordnet 的哪个相似度函数适合查找两个单词的相似度?
nltk.corpus.wordnet 中的哪个相似度函数适合查找两个单词的相似度? path_similarity()? lch_similarity()? wup_similarity()? res_similarity()? jc…