如何将 CLAWS7 标签转换为 Penn 标签?
你们中有人知道将标签从 CLAWS7 标签集转换为 Penn 标签集中的等效标签的方法吗? CLAWS7 标记集:http://ucrel.lancs.ac.uk/claws7tags.html Penn 标…
Word Net - 单词同义词和同义词相关单词构造 - Java 或 Python
我希望使用 WordNet 从一组基本术语中查找相似术语的集合。 例如,单词“不鼓励” - 潜在同义词可能是:畏惧、忧郁、受阻、悲观。 我还想识别潜在的二…
Wordnet 数据库编辑器
我下载了适用于 Windows 的最新 Wordnet 版本 (2.1),并且我想在两个动词同义词集之间建立链接。有没有我可以使用的 wordnet 同义词集编辑器?他们发…
重建现在著名的 17 岁的基于马尔可夫链的信息检索算法“Apodora”
当我们都在百思不得其解时,一名 17 岁的加拿大男孩显然发现了一种信息检索算法,该算法: a)执行精度是当前广泛使用的向量空间模型的两倍 b)“相当…
Jython:导入错误:没有名为 multiarray 的模块
当我尝试使用 Jython 调用 file 及其方法时,它显示以下错误,而我的 Numpy、Python 和 NLTK 已正确安装,并且如果我直接从 Python shell 直接运行,…
免费中文命名实体数据集或免费中文NER系统
我想在工作中使用斯坦福 NER 系统作为 NLP 工具。然而它缺乏中文命名实体的分类器模型。我必须自己训练模型。我没有通过Google找到任何可用于训练分类…
如何在 OpenNLP 中训练命名实体识别器标识符?
好的,我有以下代码来训练来自 OpenNLP 的 NER 标识符, FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new Plai…
对于Java,有一个分词器完全符合我想要的吗?
我想标记文本,但不仅仅用空格分隔。 有些东西,比如专有名称,我只想设置一个标记(例如:“Renato Dinhani Conceição”)。另一种情况:百分比(“6…