jieba分词怎样 去掉或替换 默认词库里的词?

发布于 2022-09-04 02:22:51 字数 176 浏览 21 评论 0

现在我cut

我想看电视

结果是

我 想 看电视

看了下默认的词库里有 看电视 这个词。。

我想搞成

我 想 看 电视

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

红墙和绿瓦 2022-09-11 02:22:51

jieba.add_word方法里目前还有个bug,
jieba主干已经修复了,但是旧版本可能会有
要把if freq改成if freq is not None
因为freq如果是0的话会有这个bug

jieba.add_word("看电视",0)#或者jieba.del_word("看电视")
jieba.add_word("看",100,"v")
jieba.add_word("电视",100,"n")
花伊自在美 2022-09-11 02:22:51

文档里说的很清楚了
调整词典

clipboard.png

你需要的功能:

clipboard.png

£冰雨忧蓝° 2022-09-11 02:22:51

把默认词库的‘看电视’删掉,加入‘看 3 nr’、‘电视 3 nr’,默认词库位置在安装目录下的lib/site-packages/jieba/下有一个dict.txt的文档,直接修改保存即可。最后记得删除jieba缓存文件后再运行程序(系统默认用户缓存应用程序的目录下,或者可以搜索jieba.cache文件删除)。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文