关于hanlp分词系统的问题
hanlp中用NLPTokenizer进行分词处理,出现“英国退欧对英国”分成一个词的现象,还出现 “石化]”这种类似的现象,不知道是因为什么原因。使用的jar包是1.2.9版本的,希望能给出答复,谢谢哈!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
请参考:
https://github.com/hankcs/HanLP/commit/58848ae4c9233a082519a704c16247efd6af7492