如何使用 gsub() 精确替换字符串
我有一个语料库: txt =“微电子图案内的图案层。” 我想用“形式”完全替换术语“模式”,我尝试编写代码: txt_replaced = gsub("pattern","form",t…
如何用Java创建Google日历快速添加功能?
我正在开展一个需要一点自然语言处理的学校项目。我们必须在 Java 中实现一个类似于 Google 日历快速添加功能的功能。 http://www.google.com/support…
使用 synonym() 从 wordnet 中提取同义词
假设我通过 synonym() 函数从 wordnet 中提取“help”的同义词,并得到以下结果: Str = synonyms("help") Str [1] "c(\"aid\", \"assist\", \"assist…
可以使用 Lingpipe 提取除 People、Org 和 Loc 之外的通用实体吗?
我读过 Lingpipe for NLP,发现我们有能力识别提及的人名、地点和组织的名称。我的问题是,如果我有一个文档训练集,其中提到了文本中的软件项目,我…
2010 年 Loebner 奖获得者机器人:Suzette
机器可以使用哪些技术来进行良好的对话/通过图灵测试?我知道这与自然语言理解和处理有关,但我需要更多细节。 我对荣获 2010 年 Loebner 奖的聊天机…
Remember the Milk 的字符串匹配是如何工作的?
我有兴趣开发一个与 RTM 的智能添加功能类似的解决方案。 对于那些不知道 Remember the Milk 的人来说,这里是它的工作原理:添加任务是通过输入框完…
使用 LingPipe 进行分层情感分析
这是在使用 LingPipe 机器学习工具进行情感分析的背景下进行的。我必须对大段落中的句子是否具有积极/消极情绪进行分类。我知道 LingPipe 中的以下方…
从 Wordnet 中查找与给定单词相隔固定编辑距离的单词
我正在使用 nltk 和 wordnet 编写拼写检查器,我有一些拼写错误的单词“belive”。我想要做的是从 wordnet 中找到与该给定单词的 leveshtein 编辑距离…
Lucene Porter Stemmer 线程安全吗?
快速提问,Lucene 包 (Java) 中的 porter 词干分析器线程安全吗? 我猜答案是否定的,因为您需要设置当前字符串,调用 Stem 方法,然后获取当前块以获…
使用免费工具进行实体提取/识别,同时提供 Lucene 索引
我目前正在研究从文本(许多文章来自网络)中提取人名、位置、技术单词和类别的选项,然后将其输入到 Lucene/ElasticSearch 索引中。然后附加信息作为…
一个字符串上有数百个正则表达式
跟进我之前的问题 一个字符串上有数百个正则表达式 我最终得到了一个正则表达式,如下 (section1:|section2:|section3:|section[s]?4:|(special secti…