搜索引擎的数据库分为`网页数据库`和`索引数据库`,它们之间的关系是什么?
搜索引擎的数据库分为网页数据库
和索引数据库
。
比如百度收录一个网站: www.hao123.com
是将这个网站的内容存入到网页数据库
还是存入到索引数据库
?
它们之间的关系是什么?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
简要说明一下,首先我们有一个关于网页数据表来存储网址:
然后搜索引擎爬取到的内容就存在这个网页数据表里面,之后会有相应的分词程序来给网页内容分词:
接来下根据分好的词给网页做一个倒排索引数据表:
最后,就是用户搜索关键词,比如搜索『你好』,直接就把id为1、2的相应摘要内容返回给用户即可。
当时实际情况比上面这些表要复杂的多得多,希望能帮助你理解。