搜索引擎,匹配度是如何算出来的?
用户输入 我是中国人
通过分词,得到 我
,是
,中国人
,
文章记录有
文章一:我
们都是
世界上最有智慧的中国人
...............
文章二:中国人
民解放军............
文章三:中国人
是
最厉害的,我们
为之感到自豪.....
......
......
从这三篇文章内容,如果是人为处理,肯定文章一最符合用户搜索意图,其次到文章三,再到文章二
不考虑关键字权重或其他,只从匹配度和模式上进行排序,如何实现以下排序?
文章一排第一:关键定匹配度高,模式相似,
文章三排第二:关键字匹配度高,模式不相似
文章二排第三:关键字匹配度低,模式不相似
栈用的是php+mysql
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
做到简单的搜索容易,但是要想达到你所想要的效果是复杂的算法和算法调校的过程。类似百度谷歌这样的搜索引擎更是难以简单说明的,其并不是简简单单的分词匹配的过程,还含有关键词权重、句义分析乃至用户肖像分析等复杂算法。想要简单做做就做到想要的结果,难。