我如何根据时态(现在时、过去时、将来时等)对句子进行分类?
我想解析文本并根据语法结构对句子进行分类,但我对 NLP 的了解很少,所以我什至不知道从哪里开始。 据我所读,我需要解析文本并找出(或标记?)每个…
如何从NLTK自带的样本语料中提取单词?
NLTK 附带了一些语料库样本,位于: http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 我只想有没有编码的文本。我不知道如何提取此类内容…
S-> NP VP,这些句子遵循这个格式吗?
我正在解析一些句子(来自 nltk 语料库中的就职演讲),其格式为 S -> NP VP,我想确保我正确地解析了它们,这些句子是否遵循上述格式,抱歉,如果这…
我可以从 NLTK 中的字符串集合创建语料库吗?
有没有一种方法可以创建语料库而不必在文件中包含项目。例如,我想操纵我从网络上抓取的推文或段落。我可以做类似 myCorpus = MyCorpus([ ('id', 'ite…
PyPy 可以与 NLTK 一起使用吗?
PyPy 是否可以与 NLTK 一起使用,如果可以,是否有明显的性能改进(例如贝叶斯分类器)? 当我们这样做时,其他 python 环境(shedskin 等)是否提供…
计算项目序列,python
任务是定义一个函数 count_vowels(text),它接受一个字符串 text,计算 文本中的元音(使用Python字典进行计数),并返回 元音频率信息作为字符串。 …
使用FreqDist总结词频数,python
如何使用 FreqDist 中的 fd.items() 求出词频数? >>> fd = FreqDist(text) >>> most_freq_w = fd.keys()[:10] #gives me the most 10 frequent words…
将 NLTK 与 Google App Engine 结合使用
有人将 NLTK 与 GAE 一起使用吗? 从此帖子看来,GAE 不支持 NLTK(需要特殊的安装技巧。)您知道其他轻量级的类似 Python 模块吗?谢谢。…
我可以使用命名实体识别来识别 Intranet 页面内容吗?
我是自然语言处理的新手,我想通过创建一个简单的项目来了解更多信息。 NLTK 有人建议在 NLP 中流行,所以我将在我的项目中使用它。 我想做的是: 我…
我怎样才能让这个Python2.6函数与Unicode一起工作?
我已经有了这个函数,我根据在线 NLTK 书籍第一章中的材料对其进行了修改。它对我来说非常有用,但是,尽管阅读了有关 Unicode 的章节,我还是像以前…