jcseg碰到了一个分词问题

发布于 2021-11-23 17:41:02 字数 218 浏览 844 评论 4

@狮子的魂 你好,想跟你请教个问题:我用jcseg碰到一个问题,"tag": "21527:天才流,21026:暧昧,28889:LOL",这样的一串词,前面两个数字+中文的可以正确分词,后面一个数字加引用的不能分词,请问有什么办法改变吗?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

北笙凉宸 2021-11-29 19:02:03

请用最新的版本,Jcseg现在最新版本1.9.5了,1.8.8比较旧了.

南汐寒笙箫 2021-11-29 17:14:50

我这边是别人弄号的jar文件,并没有找到你的那个配置jcseg.properties文件。请问如果这个文件应该会在什么地方

眼泪淡了忧伤 2021-11-29 12:30:35

找到配置了,但是请问下1.88版本支持吗?

回眸一笑 2021-11-27 12:26:23

对于数字+标点+字母的组合.

保证jcseg.properties中的jcseg.keeppunctuations中包含对应的标点即可.

即,你的需要在jcseg.properties的jcseg.keeppunctuations中加入":"

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文