IKAnalyzer对扩展字典的数字和字母分词问题
IKAnalyzer中支持字典扩展
如->region_dict.dic :
黄浦区
普陀区
长宁区
徐汇区
对于这样包含有中文的字典可以正常的进行切词
但是地址字典就会有问题,如:address_dict.dic:
中潭路99弄
剑河路787号
....
如果我输入“上海市普陀区中潭路998弄”
分词的结果是: [上海市, 普陀区,中,潭,路, 998, 弄]
但是我预想结果是:[上海市, 普陀区,中潭路998弄],因为我己经在address_dict.dic字典中加入了“中潭路998弄”
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
是有这样的问题,在扩展词典里的词只要包含数字或字母就会出问题。建议向作者提交bug。
我现在还不能成功使用扩展分词...5555
不知道是否解决了?我测试发现,不能对中英文组合的词汇、数字中文组合的词汇进行识别分词的。。
自己顶一下