如何在Python中使用nltk和WordNet获取单词的过去时?
运行以下命令需要哪些软件包? 代码 import nltk from nltk.corpus import wordnet v = 'go' present = present_tense(v) I got an error saying- 错…
如何使用 nltk 或 python 删除停用词
我有一个数据集,我想从中删除停用词。 我使用 NLTK 获取停用词列表: from nltk.corpus import stopwords stopwords.words('english') 究竟如何将数…
从词频创建 ARFF
我有一些代码为我提供了单词列表以及它们在文本中出现的频率,我希望代码能够将前 10 个单词自动转换为带有 @RELATION wordfrequencies @ATTRIBUTE wo…
使用计算机语言处理工具,考虑上下文,翻译单个单词
我想为外语学习者自动注释文本并翻译困难的单词。 例如,如果原文是: 埃尔加托埃斯塔恩拉卡萨德米斯韦西诺斯 萨德米斯韦西诺斯 成为 El gato esta en…
使用 NLTK 对 POS 标记词进行词形还原?
我用 nltk.pos_tag() 标记了一些单词,因此它们被赋予了树库标签。我想使用已知的 POS 标签对这些单词进行词形还原,但我不知道如何做。我正在查看 Wo…
如何在我的网络服务器上安装 NLTK
好的,我编辑了我的问题,因为我现在有一个支持 ssh 的主机。 如何使用 ssh 安装适用于 python 的 nltk 模块? 我尝试联系支持人员,但他们似乎无法帮…
韩国、泰国和印度尼西亚 POS 标记器
有人可以推荐一个适用于韩语、印度尼西亚语、泰语和越南语的开源词性标注器吗? 我可以用它来标记我当前拥有的语料库数据。 (例如 stanford-postagge…
在 NLTK Python 的朴素贝叶斯分类器中使用文档长度
我正在 Python 中使用 NLTK 构建垃圾邮件过滤器。我现在检查单词的出现情况并使用 NaiveBayesClassifier,结果准确度为 0.98,垃圾邮件的 F 测量值为 …
RegEx Tokenizer 将文本拆分为单词、数字和标点符号
我想做的就是把一个文本拆分成他的终极元素。 例如: from nltk.tokenize import * txt = "A sample sentences with digits like 2.119,99 or 2,99 ar…
将句子放入列表中 - python
我知道 nltk 可以分割句子并使用以下代码将其打印出来。 但是我如何将句子放入列表中而不是输出到屏幕上? import nltk.data from nltk.tokenize impo…
使用 WordNet 和 NLTK 替换语料库中的同义词 - python
尝试编写简单的 python 脚本,该脚本将使用 NLTK 查找并替换 txt 文件中的同义词。 以下代码给我错误: Traceback (most recent call last): File "C:…
有谁知道如何在 nltk 上配置 hunpos 包装类?
我已经尝试了以下代码并安装了 来自 http://code.google.com/p/hunpos/downloads/list 英语-wsj-1.0 hunpos-1.0-linux.tgz 我已将文件提取到“~/”目…