分词技术,动态扩展词典

发布于 2021-11-12 06:02:37 字数 155 浏览 750 评论 3

1.对于使用IK和lucene集合做中文搜索。假设对于一个论坛系统,大量用户发帖,帖子内容中出现IK不能分词的词句,假设啊比如AB,IK的处理结果是A和B,而不是AB。但是用户搜索就是用AB做搜索,结果发现,查询无结果。这种情况该怎么处理。我们难道把类似的单子,只要发现搜索无结果就加入用户词典?再更新下索引吗

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

少女净妖师 2021-11-18 05:34:59

请教一下,你说的《源创汇》厦门站活动,是什么,没有找到

千笙结 2021-11-16 14:05:51

回复
http://www.oschina.net/events 源创汇系列

蓝颜夕 2021-11-15 04:52:52

1.如果IK在索引的时候切分成A|B,那么理论上用户搜素AB的时候,关键词也会被切分成A|B才对。

2.关于搜索的优化,请参看《源创汇》厦门站活动,IK分词与搜索主题中的SWMC搜索算法来解决上述问题。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文