IKAnalyzer的分词结果有误

发布于 2021-11-25 17:53:47 字数 418 浏览 929 评论 4

@林良益 你好,想跟你请教个问题:

下面这个程序,使用IKanalyzer进行分词,“你好啊”像这样的“X好啊”形式的词都会出现把X删掉,只出现“好啊”,如下面:

我觉得,分词的话应该不能删减原话,所以想这个是不是IKAnalyzer处理的问题。

代码在:http://yunpan.cn/cAXgwHbqMXfjp  访问密码 e3cd

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

裸钻 2021-11-28 23:29:49

知道了,参考的项目里有个stopword.dic,之前不理解这是什么用处。现在明白了,出现在这个文件里的关键字将会被删掉

伪装你 2021-11-28 15:59:34

定义dic是为了解决有些分词不正确的问题吧。现在这不是分词正不正确的问题了。 分词的话,不管划分得正不正确,都不能删减原话,而这里删了第一个字

睫毛上残留的泪 2021-11-28 12:04:26

要是分个词少几个字,那就麻烦了

月牙弯弯 2021-11-28 02:20:55

你可以自己定义dic嘛

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文