可以使用 Lingpipe 提取除 People、Org 和 Loc 之外的通用实体吗?
我读过 Lingpipe for NLP,发现我们有能力识别提及的人名、地点和组织的名称。我的问题是,如果我有一个文档训练集,其中提到了文本中的软件项目,我…
如何编译调用MeCab - 日语词性和日语词性的java文件形态分析仪?
我正在尝试使用 MeCab (http://mecab.sourceforge.net/#download) 对日语句子进行分词,并按词性标记每个单词。我按照以下说明安装了 MeCab http://me…
高效的关键词检测/提取。预定义的关键字集
如何有效地从字符串中提取相关的关键字?我的关键字列表是预定义的。例如,在一篇关于 Michelle Obama 的文章中也提到了 Barack Obama,我想使用关键…
从 Lucene 中的 SpanNearQuery 获取与匹配项对应的单词
我需要检索文本中与 SpanNearQuery.getSpans() 返回的 Spans 匹配相对应的单词。例如,如果我的文本是 [abcdef] 并且我使用 SpanNearQueries 来查询“…
java中Tf Idf的任何教程或代码
我正在寻找一个可以计算 tf-idf 计算的简单 java 类。我想对两个文档进行相似性测试。我发现很多使用 tf-idf 类的大 API。我不想使用大的 jar 文件,…
- 共 1 页
- 1