分词技术,动态扩展词典
1.对于使用IK和lucene集合做中文搜索。假设对于一个论坛系统,大量用户发帖,帖子内容中出现IK不能分词的词句,假设啊比如AB,IK的处理结果是A和B,而不是AB。但是用户搜索就是用AB做搜索,结果发现,查询无结果。这种情况该怎么处理。我们难道把类似的单子,只要发现搜索无结果就加入用户词典?再更新下索引吗
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
请教一下,你说的《源创汇》厦门站活动,是什么,没有找到
回复
http://www.oschina.net/events 源创汇系列
1.如果IK在索引的时候切分成A|B,那么理论上用户搜素AB的时候,关键词也会被切分成A|B才对。
2.关于搜索的优化,请参看《源创汇》厦门站活动,IK分词与搜索主题中的SWMC搜索算法来解决上述问题。