jieba分词怎样 去掉或替换 默认词库里的词?
现在我cut
我想看电视
结果是
我 想 看电视
看了下默认的词库里有 看电视
这个词。。
我想搞成
我 想 看 电视
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
现在我cut
我想看电视
结果是
我 想 看电视
看了下默认的词库里有 看电视
这个词。。
我想搞成
我 想 看 电视
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
jieba.add_word方法里目前还有个bug,
jieba主干已经修复了,但是旧版本可能会有
要把
if freq
改成if freq is not None
因为freq如果是0的话会有这个bug
文档里说的很清楚了
调整词典
你需要的功能:
把默认词库的‘看电视’删掉,加入‘看 3 nr’、‘电视 3 nr’,默认词库位置在安装目录下的lib/site-packages/jieba/下有一个dict.txt的文档,直接修改保存即可。最后记得删除jieba缓存文件后再运行程序(系统默认用户缓存应用程序的目录下,或者可以搜索jieba.cache文件删除)。