结巴分词跟smallseg相比哪个更好一些?

发布于 2021-11-16 00:53:15 字数 0 浏览 779 评论 8

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(8

傾城如夢未必闌珊 2021-11-21 06:25:28

为何jieba用Python开发了,之前smallseg用java,是发现Python更好么还是怎样

月牙弯弯 2021-11-21 03:13:32

相关性分析用什么算法啊?

飘过的浮云 2021-11-21 02:57:29

回复
根据《现代信息检索》里面的一些概念摸索出来的算法...

尐偏执 2021-11-19 08:26:44

大牛啊,哈哈,不明白“歧义纠错”是什么意思,去年做一个相关性分析项目用了您的smallseg库,觉得很不错,当时感觉比lucene支持的庖丁分词切出来的结果更符合个人需求...

泪冰清 2021-11-18 18:42:43

+1

泪冰清 2021-11-18 15:31:37

哥 你太强大了

坚持沉默 2021-11-16 11:16:47

回复
同膜拜! 好东西+开源,佩服:)

疾风者 2021-11-16 01:05:35

1)smallseg和结巴分词的作者都是我

2)smallseg的歧义纠错和新词发现功能都远不如结巴分词

3)smallseg轻量级一些,内存占用小一半

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文