如何安装“Ruby Linguistics With Verb Conjugation”?
我下载了“Ruby Linguistics With Verb Conjugation”的源代码。 如何安装使用?我需要将它编译成一些 gem 吗?…
提取“((Adj|名词)”|((Adj|名词)(Noun-Prep)?)(Adj|名词))名词”来自文本(Justeson 和 Katz,1995)
是否可以使用 Justeson 和 Katz (1995) 提出的 ((Adj|Noun)+|((Adj|Noun)(Noun-Prep)?)(Adj|Noun))Noun 来提取R 包 openNLP? 也就是说,我想使用这种…
理解 semcor 语料库结构 h
我正在学习NLP。我目前正在玩词义消歧。我计划使用 semcor 语料库作为训练数据,但我无法理解 xml 结构。我尝试谷歌搜索,但没有得到任何描述 semcor …
语言特定怪癖的 Damerau–Levenshtein 距离
对于讲荷兰语的人来说,两个字符“ij”被认为是一个字母,可以很容易地与“y”交换。 对于我正在从事的项目,我想要一个 Damerau– 的变体 - Levensht…
在哪里可以找到德语的带有性别和复数的单词表?
Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗?更新问题,使其关于- Stack Overflow 的主题。 12…
计算相对编辑距离 - 有意义吗?
我使用 Daitch-Mokotoff soundexing 和 Damerau-Levenshtein 来确定应用程序中的用户条目和值是否“相同”。 编辑距离应该用作绝对值吗?如果我有一个…
Justadistraction:标记化没有空格的英语。村上羊人
我想知道如果删除空格,您将如何对英语(或其他西方语言)的字符串进行标记? 这个问题的灵感来源于村上小说《跳舞跳舞'中的羊人 角色小说中,羊人被…
贝叶斯分类器的 PHP 实现:将主题分配给文本
在我的新闻页面项目中,我有一个具有以下结构的数据库表news: - id: [integer] unique number identifying the news entry, e.g.: *1983* - title: […