我可以从 NLTK 中的字符串集合创建语料库吗?
有没有一种方法可以创建语料库而不必在文件中包含项目。例如,我想操纵我从网络上抓取的推文或段落。我可以做类似 myCorpus = MyCorpus([ ('id', 'ite…
PyPy 可以与 NLTK 一起使用吗?
PyPy 是否可以与 NLTK 一起使用,如果可以,是否有明显的性能改进(例如贝叶斯分类器)? 当我们这样做时,其他 python 环境(shedskin 等)是否提供…
计算项目序列,python
任务是定义一个函数 count_vowels(text),它接受一个字符串 text,计算 文本中的元音(使用Python字典进行计数),并返回 元音频率信息作为字符串。 …
使用FreqDist总结词频数,python
如何使用 FreqDist 中的 fd.items() 求出词频数? >>> fd = FreqDist(text) >>> most_freq_w = fd.keys()[:10] #gives me the most 10 fr…
将 NLTK 与 Google App Engine 结合使用
有人将 NLTK 与 GAE 一起使用吗? 从此帖子看来,GAE 不支持 NLTK(需要特殊的安装技巧。)您知道其他轻量级的类似 Python 模块吗?谢谢。…
我可以使用命名实体识别来识别 Intranet 页面内容吗?
我是自然语言处理的新手,我想通过创建一个简单的项目来了解更多信息。 NLTK 有人建议在 NLP 中流行,所以我将在我的项目中使用它。 我想做的是: 我…
我怎样才能让这个Python2.6函数与Unicode一起工作?
我已经有了这个函数,我根据在线 NLTK 书籍第一章中的材料对其进行了修改。它对我来说非常有用,但是,尽管阅读了有关 Unicode 的章节,我还是像以前…
如何用Python检查一个单词是否是英文单词?
我想在 Python 程序中检查一个单词是否在英语词典中。 我相信 nltk wordnet 接口可能是可行的方法,但我不知道如何使用它来完成如此简单的任务。 def …
如何在 Python 中使这个随机文本生成器更加高效?
我正在研究一个随机文本生成器 - 不使用马尔可夫链 - 目前它的工作没有太多问题。首先,这是我的代码流程: 输入一个句子作为输入 - 这称为触发字符串…
使用 NLTK 将早期现代英语转换为 20 世纪拼写
我有一个字符串列表,这些字符串都是以“th”结尾的早期现代英语单词。这些词包括hath、appointeth、demandeth等——它们都是第三人称单数的变位形式…