搜索引擎

搜索引擎

文章 225 浏览 1.4k

寻找支持「子字段」查询的开源全文搜索引擎

比如有多个以下格式的文档: { "id": 1, "text": "支持全文检索的文本", "items": [ { "k1": 1, "k2": 2, }, { "k1": 3, "k2": 4, } ], 'boost': 1.1…

冰雪梦之恋 2022-09-01 05:15:05 13 0

搜索引擎如何实现的条件过滤

都知道搜索时候的输入的关键词是通过分词以后利用的倒排索引找到的文档ID,然后按照权重排序,但是有些搜索还支持一些条件过滤,如果用关键词搜索出…

梦途 2022-08-31 09:28:34 16 0

网络爬虫的结果失效的处理

有这么一个面试题: 假如某个网站可以发布租房信息,比如位置,联系方式等,这条信息会被搜索引擎等网络爬虫收录,如果这条租房信息被删, 那用户从…

杀手六號 2022-08-29 22:41:47 14 0

为什么有些没人用的网址PR那么高

如题,这些即将过期的域名很多连网页都打不开,或Alexa显示是IANA保留地址,也没啥历史PV可查,为什么google PR却那么高? …

所谓喜欢 2022-08-29 22:24:07 35 0

关于百度搜索引擎频发收录被黑网页的问题

我的个人网站部署在小运营商的虚拟主机上,虽然说便宜,但是服务器老是被攻破,所以就出现了无数的博彩垃圾页面,更不幸的是百度还把这些页面给收录…

梦在深巷 2022-08-29 21:42:50 14 0

如何定制一款适合自己的搜索引擎?

我在搜索内容时想自己调整一些网站的权重,有没有提供这种服务的搜索网站。 …

迷雾森÷林ヴ 2022-08-29 21:24:38 18 0

为什么搜索引擎大都是分页的, 而不采用自动加载?

用了一段时间 DuckduckGo, DuckduckGo 就是翻到底部, 自动加载更新的, 然后就很奇怪, 其他的各种知名得多的搜索引擎都是采用分页的, 可是从交互上说,…

浮生面具三千个 2022-08-29 18:31:36 27 0

关于搜索引擎robots.txt的问题

如果设置了不可通过浏览器输入URL可访问资源,会不会对设置的robots.txt有影响,换句话说,搜索引擎能不能访问URL的资源呢? …

谎言 2022-08-29 18:29:21 12 0

文献检索系统中,要支持逻辑表达式查询,倒排索引的结构具体应该怎么设计呢?

文献检索系统中,要支持逻辑表达式查询,倒排索引的结构具体应该怎么设计呢?然后如果由索引查找到文档id,由id如何找到具体的文档呢? …

—━☆沉默づ 2022-08-28 12:29:09 8 0

数据库10w+数据如何做搜索?

情况是这样的: 数据库中有10W+条数据,想要增加搜索功能,比如搜索某一字段包含“XX”的所有记录,应该怎么查呢,应该有sql函数可以查到匹配的记录…

橙幽之幻 2022-08-28 01:04:19 11 0

关于搜索引擎定义是否收录的robots.txt文件

网上我查过了!如果在网站源码的主目录定义robots.txt文件,它是尊照了robots搜索引擎协议! 它的作用是定义子目录下的网站不允许搜索引擎收录,或者…

游魂 2022-08-28 00:29:20 16 0

如果让自己的php页面被搜索引擎检索?

自己在SAE上写了一个php网站: http://jollywing.sinaapp.com/ 里面很早就发了一些文章做实验,发现用google或是百度来搜索,即使搜索我文章中的原句,…

×纯※雪 2022-08-27 12:48:54 11 0

关于solr等搜索引擎的疑问?

我现在想从网上爬特定关键词的网页,目前还没有目标网站,想请问下solr这样的搜索引擎支持没有目标网站的爬取了,爬取的效率大概怎么样? …

別甾虛僞 2022-08-27 12:00:24 19 0

搜索引擎和爬虫的区别?

我的理解是爬虫是搜索引擎的一部分,负责信息的采集。 搜索引擎其他两个部分应该还包括语义分析和全文索引,不知道我这样的理解对不对? 还有请问下现…

神妖 2022-08-27 11:34:02 19 0

如何做这种模糊搜索

array = ["关于我们-网站公告-公告内页.html", "关于我们-网站公告-公告内页.html", "关于我们-网站公告-新闻内页.html", "关于我们.html", "联系我们…

卖梦商人 2022-08-26 18:29:56 14 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文