Justadistraction:标记化没有空格的英语。村上羊人
我想知道如果删除空格,您将如何对英语(或其他西方语言)的字符串进行标记? 这个问题的灵感来源于村上小说《跳舞跳舞'中的羊人 角色小说中,羊人被…
Lucene 标准分析器与 Snowball
刚刚开始使用 Lucene.Net。我使用标准分析器索引了 100,000 行,运行了一些测试查询,并注意到如果原始术语是单数,则复数查询不会返回结果。我知道雪…
opennlp vs 斯坦福大学 nlptools vs 伯克利大学
您好,目标是解析像维基百科这样的大型语料库,以生成最可能的解析树和命名实体识别。就性能和准确性而言,哪个库是实现这一目标的最佳库?有人使用过…
从 wordnet 获取名词和动词
我正在努力寻找一个单词是名词还是动词等 我找到了 MIT Java Wordnet Interface 有一个像这样的示例代码,但是当我使用它时,我得到错误,字典是抽象…
Opennlp 1.5 用于 SentenceDetector?
现在我有以下代码: SentenceModel sd_model = null; try { sd_model = new SentenceModel(new FileInputStream( "opennlp/models/english/sentdetect…
如何解析文档并替换内容以将上下文从第一人称或第二人称更改为第三人称?
基本上我需要一些文字,例如: 我有一个蛋卷冰淇淋。 你有麻烦了。 你需要洗澡。 并将其从第一人或第二人更改为第三人。 他有一个蛋卷冰淇淋。 他有麻…
如何在 Python 中使用 NLP、RegEx 查找句子中的日期
任何人都可以建议我一些查找和解析日期的方法(任何格式,“Aug06”,“Aug2006”,“2008年8月2日”,“2006年8月19日”,“08-06”,“01-08-06”)…
如何对不使用空格作为单词分隔符的语言(如中文)执行Python split()?
我想将一个句子分成一个单词列表。 对于英语和欧洲语言,这很简单,只需使用 split() >>> "This is a sentence.".split() ['This', 'is', 'a', 'sente…