如何在 nltk 中使用 hunpos 标记文本文件?
有人可以帮我解决在 nltk 中标记语料库的 hunpos 语法吗? 我要为 hunpos.HunPosTagger 模块? 如何对语料库进行 HunPosTag?请参阅下面的代码。 impo…
使用 Python 从个人地名词典中识别命名实体
我尝试使用 NLTK 在 python 中进行命名实体识别。 我想提取个人技能列表。 我有技能列表,想在申请中搜索它们并标记技能。 我注意到 NLTK 有 NER 标签…
如何通过文本文件编写 hunpos 脚本?
我的目的是使用 POS 解析器 HunPos http://code.google 解析多个文本文件。 com/p/hunpos/wiki/UserManualI 有没有办法通过一堆文本文件来bash脚本hun…
Python NLTK 标记断言错误
当使用 NLTK 通过 PlainTextCorpusReader 处理大约 5000 个帖子时,我遇到了奇怪的断言错误。对于我们的一些数据集,我们没有任何重大问题。然而,在…
如何统计文件中的句子数、单词数和字符数?
我编写了以下代码来标记来自文件 samp.txt 的输入段落。谁能帮我查找并打印文件中的句子数、单词数和字符数?为此,我在 python 中使用了 NLTK。 >&…
使用稀疏表示的 nltk.cluster
我对 Python 还很陌生。 我正在尝试使用 nltk.cluster 包将简单的 kMeans 应用于单词文档矩阵。虽然当矩阵是类似 numpy 数组的对象列表时它可以工作,…
给定一个名词,确定“性别”的最佳方法是什么?
我的任务是确定广告适合男性还是女性。 确定这一点的最佳方法是什么? 这些词看起来像这样: Cheetos Coca Cola Nike Ferrari 24 Arrested Developmen…
我如何根据时态(现在时、过去时、将来时等)对句子进行分类?
我想解析文本并根据语法结构对句子进行分类,但我对 NLP 的了解很少,所以我什至不知道从哪里开始。 据我所读,我需要解析文本并找出(或标记?)每个…
如何从NLTK自带的样本语料中提取单词?
NLTK 附带了一些语料库样本,位于: http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 我只想有没有编码的文本。我不知道如何提取此类内容…
S-> NP VP,这些句子遵循这个格式吗?
我正在解析一些句子(来自 nltk 语料库中的就职演讲),其格式为 S -> NP VP,我想确保我正确地解析了它们,这些句子是否遵循上述格式,抱歉,如果…