我想问的是这个IKAnalyzer必须和lucene搭配吗?能否独立进行分词的?

发布于 2021-11-08 15:56:45 字数 15 浏览 742 评论 10

 如题

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(10

眼泪淡了忧伤 2021-11-13 22:21:03

引用来自#9楼“小鸵鸟”的帖子

引用来自#8楼“冰封情”的帖子

打个比方:我的文章标题是《2011年地税局党组书记在三八妇女节致辞讲话》

经过分词处理后的结果:
//调用了SmartChineseAnalyzer方法
2011 | 年 | 地税局 | 党组 | 书记 | 在 | 三 | 八 | 妇女节 | 致辞 | 讲话
//直接用IKSegmentation
2011 | 年 | 地税局 | 地税 | 税局 | 党组书记 | 党组 | 书记 | 记在 | 在三 | 三八妇女节 | 三八 | 八 | 妇女节 | 妇女 | 致辞 | 讲话

按照上面显然肯定不是最好的,合理的应该是:
2011年 | 地税局 | 党组书记 | 三八妇女节 | 致辞 | 讲话
如果能这样切割出来,那中间估计不是这样简单就能实现了,所以这个问题估计有点深度。不知道哪位童鞋有研究过呢?

冷默言语 2021-11-13 22:21:02

这个需要语义识别...

像你 2021-11-13 22:20:30

引用来自#8楼“冰封情”的帖子

打个比方:我的文章标题是《2011年地税局党组书记在三八妇女节致辞讲话》

经过分词处理后的结果:
//调用了SmartChineseAnalyzer方法
2011 | 年 | 地税局 | 党组 | 书记 | 在 | 三 | 八 | 妇女节 | 致辞 | 讲话
//直接用IKSegmentation
2011 | 年 | 地税局 | 地税 | 税局 | 党组书记 | 党组 | 书记 | 记在 | 在三 | 三八妇女节 | 三八 | 八 | 妇女节 | 妇女 | 致辞 | 讲话

按照上面显然肯定不是最好的,合理的应该是:
2011年 | 地税局 | 党组书记 | 三八妇女节 | 致辞 | 讲话
如果能这样切割出来,那中间估计不是这样简单就能实现了,所以这个问题估计有点深度。不知道哪位童鞋有研究过呢?

笑红尘 2021-11-13 22:19:38

打个比方:我的文章标题是《2011年地税局党组书记在三八妇女节致辞讲话》

经过分词处理后的结果:
//调用了SmartChineseAnalyzer方法
2011 | 年 | 地税局 | 党组 | 书记 | 在 | 三 | 八 | 妇女节 | 致辞 | 讲话
//直接用IKSegmentation
2011 | 年 | 地税局 | 地税 | 税局 | 党组书记 | 党组 | 书记 | 记在 | 在三 | 三八妇女节 | 三八 | 八 | 妇女节 | 妇女 | 致辞 | 讲话

按照上面显然肯定不是最好的,合理的应该是:
2011年 | 地税局 | 党组书记 | 三八妇女节 | 致辞 | 讲话
如果能这样切割出来,那中间估计不是这样简单就能实现了,所以这个问题估计有点深度。不知道哪位童鞋有研究过呢?

猫性小仙女 2021-11-13 22:09:46

可能楼上有点误解,也许是我没说清楚,其实我想表达的意思是中title中提取关键词,现在我知道了这个实现有点困难,不是一般就可以实现的

檐上三寸雪 2021-11-13 20:02:51

#4:

lex.getLexemeText()

这个不就是获得了单个分词嘛?  没明白你意识.

把昨日还给我 2021-11-13 01:35:42

引用来自#3楼“小鸵鸟”的帖子

可以独立.

IKSegmentation iks = new IKSegmentation(read);

while (true) {

Lexeme lex = null;

...

lex = iks.next();

lex.getLexemeText();

....

}

清晨说ぺ晚安 2021-11-12 20:45:41

可以独立.

IKSegmentation iks = new IKSegmentation(read);

while (true) {

Lexeme lex = null;

...

lex = iks.next();

lex.getLexemeText();

....

}

千笙结 2021-11-11 20:32:00

似乎不行吧,加个lucene的jar包就可以了啊

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文