使用 Open Office API for Python (UNO) 的复数单词
我想在Python中检索不同语言的复数单词。 我知道 openoffice 有一个名为 uno (import uno) 的 API,它应该为我提供使用 openoffice 的语言词典的这种…
使用 Hadoop 解析批量文本:生成密钥的最佳实践
我有一组“大”的行分隔完整句子,正在使用 Hadoop 进行处理。我开发了一个映射器,其中应用了一些我最喜欢的 NLP 技术。我在原始句子集上映射了几种…
将域名拆分为组成词(如果可能)?
我想将域名分解为组成词和数字,例如 iamadomain11.com = ['i', 'am', 'a', 'domain', '11'] 我该怎么做?我知道可能有多种可能,但是,我目前还可以…
从自然语言生成 RDF
是否有任何工具可用于从自然语言生成 RDF? SIMILE 项目编译的RDFizers 列表只提到了一个,即 Monrai Cypher。不幸的是,它似乎是 Monrai Technologie…
将文档添加到评分的 TF-IDF 集合中?
我有大量已计算 TF-IDF 的文档。我正准备向集合中添加更多文档,我想知道是否有一种方法可以将 TF-IDF 分数添加到新文档中,而无需重新处理整个数据库…
与“自然语言”相似吗?编程语言令人信服的卖点?
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
如何从 Wordnet 中获取按出现概率排序的同义词
我正在 Wordnet 中搜索一大堆单词的同义词。按照我的方式,当某个单词有多个同义词时,结果按字母顺序返回。我需要的是让它们按出现概率排序,并且我…
如何检测用户输入文本的语言?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …