在哪里可以下载标记词词典和规则?
我正在学习通过应用转换规则来标记词性。第一步是使用字典为文本中的每个单词标记可能的词性,例如: communicative JJ communicator NN communicator…
在 NLTK pos_tag 中,为什么要使用“hello”?被归类为名词?
我试过了 text = nltk.word_tokenize("hello, my name is John") words = nltk.pos_tag(text) for w in words: print "%s = %s" % (w[0], w[1]) ,我…
Bing/Google/Flickr API:如何找到与 150,000 个日语句子中的每个句子对应的图像?
我正在做词性和词性日语句子的形态分析项目。每个句子都有自己的网页。为了使这个页面更加直观,我想展示一张与这句话有某种关系的图片。例如,对于句…
将 WordNet 数据库解析为 SQL?
我想要 SQL 格式的 WordNet 数据库,所以我正在考虑尝试编写一个 WordNet 文件的解析器。然而,在开始之前我想知道是否有任何现有的解析器或者是否有…
如何优化 PHP 脚本以从 Yahoo! 获取日语句子的语音读法日本API?
我编写了一个 PHP 脚本,它从文件中读取日语句子,使用 Yahoo! 获取每个句子的语音读法。 Japan API 并将它们写入输出文件。但该脚本非常慢,在我的 M…