autoload bug

发布于 2021-11-27 15:41:10 字数 368 浏览 885 评论 4

@狮子的魂 你好,想跟你请教个问题:我本想使用autoload 功能,修改jcseg.properties autoload=1 但是并没有生效,通过观察源码发现ADictionary:85 ,111 行 config.getLexiconPath()调用,lexicon本身就是数组,这样调用返回的数组.toString() 导致无法找到文件路径。

我只是简单修改了一下config.getLexiconPath()[0],但是发现autoload完成后,分词并没有按照新增词汇进行分词,不知道这是什么原因了

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

鹤舞 2021-11-29 12:20:02

这是特殊需求,可能需要二次开发,目前,你可以使用Jcseg的同义词功能来实现该需求。

岁吢 2021-11-29 10:19:24

这种情况下,通常二次切分可以满足需求。将范冰冰,切分成:“范冰冰 /范冰”

狠疯拽 2021-11-29 08:48:05

感谢您的答复,现在我结合solr进行人名搜索的时候,我输入范冰,想查到范冰和范冰冰这两种人名,不知道这个现在能实现吗?

绝影如岚 2021-11-29 07:36:20

啊,这个问题没提出好多次了,也提交了修复代码很久了。因为1.9.6还没发布,大家用的都是旧代码,但是git经常更新。

git@osc  http://git.oschina.net/lionsoul/jcseg 使用最新的代码即可。

新增加了词不一定就可以按照新词来切分,Jcseg有他的组合机制,可以多添加几个词试试。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文