@狮子的魂 你好,想跟你请教个问题:
碰到一个难题,我用户词典中加入了601398,假设用“买入601398一百股”,可以识别出601398,
若是“买入601398100股”,识别出来就成了601398100,有人提示用再分词,但是没有头绪,不知道你有没有可以建议的????
用的是最新1.9.5版本的jcseg
嗯,谢谢你,这个问题我也确实是用检测模式勉强解决了~ 再问你个问题~最近用这个做项目,问题比较多,嘿嘿~ 就是我把lexicon目录下的词库都清空了,但是还是可以进行分词,我加入的词条被拆分了,不知道是什么逻辑,出来的词性是en或者null,en是什么意思啊???数字和英文是en好像
回复没有词库,Jcseg默认使用一元分词。中文分词器通常不对英文做词性定义,en统一表示英文!
回复嗯~谢谢你的回答
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(3)
嗯,谢谢你,这个问题我也确实是用检测模式勉强解决了~ 再问你个问题~最近用这个做项目,问题比较多,嘿嘿~ 就是我把lexicon目录下的词库都清空了,但是还是可以进行分词,我加入的词条被拆分了,不知道是什么逻辑,出来的词性是en或者null,en是什么意思啊???数字和英文是en好像
回复
没有词库,Jcseg默认使用一元分词。中文分词器通常不对英文做词性定义,en统一表示英文!
回复
嗯~谢谢你的回答