如何在Python-NLTK中使用Gale-Church算法?
gale-church 算法可在 python-NLTK 中使用,但任何人都可以向我展示如何在 python 脚本中调用该函数的示例吗?我不知道该怎么做。 http ://code.googl…
使用 WordNet 查找同义词、定义和例句
我需要获取一个包含一个单词的输入文本文件。然后我需要使用 wordnet 找到该词的引理名称、定义和同义词集示例。我已经阅读了这本书:“Python Text H…
如何在Python中使用nltk和WordNet获取单词的过去时?
运行以下命令需要哪些软件包? 代码 import nltk from nltk.corpus import wordnet v = 'go' present = present_tense(v) I got an error saying- 错…
如何使用 nltk 或 python 删除停用词
我有一个数据集,我想从中删除停用词。 我使用 NLTK 获取停用词列表: from nltk.corpus import stopwords stopwords.words('english') 究竟如何将数…
从词频创建 ARFF
我有一些代码为我提供了单词列表以及它们在文本中出现的频率,我希望代码能够将前 10 个单词自动转换为带有 @RELATION wordfrequencies @ATTRIBUTE wo…
使用计算机语言处理工具,考虑上下文,翻译单个单词
我想为外语学习者自动注释文本并翻译困难的单词。 例如,如果原文是: 埃尔加托埃斯塔恩拉卡萨德米斯韦西诺斯 萨德米斯韦西诺斯 成为 El gato esta en…
使用 NLTK 对 POS 标记词进行词形还原?
我用 nltk.pos_tag() 标记了一些单词,因此它们被赋予了树库标签。我想使用已知的 POS 标签对这些单词进行词形还原,但我不知道如何做。我正在查看 Wo…
如何在我的网络服务器上安装 NLTK
好的,我编辑了我的问题,因为我现在有一个支持 ssh 的主机。 如何使用 ssh 安装适用于 python 的 nltk 模块? 我尝试联系支持人员,但他们似乎无法帮…
韩国、泰国和印度尼西亚 POS 标记器
有人可以推荐一个适用于韩语、印度尼西亚语、泰语和越南语的开源词性标注器吗? 我可以用它来标记我当前拥有的语料库数据。 (例如 stanford-postagge…
在 NLTK Python 的朴素贝叶斯分类器中使用文档长度
我正在 Python 中使用 NLTK 构建垃圾邮件过滤器。我现在检查单词的出现情况并使用 NaiveBayesClassifier,结果准确度为 0.98,垃圾邮件的 F 测量值为 …
RegEx Tokenizer 将文本拆分为单词、数字和标点符号
我想做的就是把一个文本拆分成他的终极元素。 例如: from nltk.tokenize import * txt = "A sample sentences with digits like 2.119,99 or 2,99 ar…