IKAnalyzer对扩展字典的数字和字母分词问题

发布于 2021-11-24 00:29:47 字数 301 浏览 829 评论 4

IKAnalyzer中支持字典扩展
如->region_dict.dic :
黄浦区
普陀区
长宁区
徐汇区
对于这样包含有中文的字典可以正常的进行切词
但是地址字典就会有问题,如:address_dict.dic:
中潭路99弄
剑河路787号
....

如果我输入“上海市普陀区中潭路998弄”
分词的结果是: [上海市, 普陀区,中,潭,路, 998, 弄]
但是我预想结果是:[上海市, 普陀区,中潭路998弄],因为我己经在address_dict.dic字典中加入了“中潭路998弄”

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

清风夜微凉 2021-11-29 04:23:54

是有这样的问题,在扩展词典里的词只要包含数字或字母就会出问题。建议向作者提交bug。

浮生未歇 2021-11-29 04:02:57

我现在还不能成功使用扩展分词...5555

心欲静而疯不止 2021-11-29 03:55:05

不知道是否解决了?我测试发现,不能对中英文组合的词汇、数字中文组合的词汇进行识别分词的。。

嘦怹 2021-11-24 11:18:48

自己顶一下

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文