autoload bug
@狮子的魂 你好,想跟你请教个问题:我本想使用autoload 功能,修改jcseg.properties autoload=1 但是并没有生效,通过观察源码发现ADictionary:85 ,111 行 config.getLexiconPath()调用,lexicon本身就是数组,这样调用返回的数组.toString() 导致无法找到文件路径。
我只是简单修改了一下config.getLexiconPath()[0],但是发现autoload完成后,分词并没有按照新增词汇进行分词,不知道这是什么原因了
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
这是特殊需求,可能需要二次开发,目前,你可以使用Jcseg的同义词功能来实现该需求。
这种情况下,通常二次切分可以满足需求。将范冰冰,切分成:“范冰冰 /范冰”
感谢您的答复,现在我结合solr进行人名搜索的时候,我输入范冰,想查到范冰和范冰冰这两种人名,不知道这个现在能实现吗?
啊,这个问题没提出好多次了,也提交了修复代码很久了。因为1.9.6还没发布,大家用的都是旧代码,但是git经常更新。
git@osc http://git.oschina.net/lionsoul/jcseg 使用最新的代码即可。
新增加了词不一定就可以按照新词来切分,Jcseg有他的组合机制,可以多添加几个词试试。