Solr 和网站索引来创建网站搜索

发布于 2024-08-25 15:51:35 字数 235 浏览 6 评论 0原文

我试图在一个简单的 http 站点上构建“站点搜索”。

我有一个网站,我们称之为 www.mycompany.com,它是纯 html 的。

有没有一种简单的方法可以使用 solr 索引整个站点以使用 solr 作为引擎构建全文搜索?

我用谷歌搜索了一下,找不到任何特定类型的信息: 做A 做B ... 利润!

如果我对 solr 的用途有点不明白,请告诉我:P

提前致谢。

I was trying to build a 'site search' on a simple http site.

I have a site, lets call it www.mycompany.com, that is pure html.

Is there an easy way to use solr to index the entire site to build a full text search using solr as the engine?

I googled for a bit and could not find anything specific of the type:
Do A
Do B
...
profit!

Let me also know if I am a bit off with what is solr for :P

Thanks in advance.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

孤蝉 2024-09-01 15:51:35

Solr 仅用于索引和搜索文本,它没有爬虫,因为它超出了项目的范围。

不过,请看一下 Nutch,它是一个爬虫,最初设置起来并不难。

如果您需要一些 Solr 特定的功能来搜索索引,Nutch 和 Solr 可以集成

Solr is only for indexing and searching text, it does not have a crawler since it's out the project's scope.

However take a look at Nutch, which is a crawler and not too hard to setup initially.

Nutch and Solr can be integrated if you need some Solr-specific feature to search the index.

_蜘蛛 2024-09-01 15:51:35
$ bin/solr create -c corename
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1

这将建立网站的基本索引,但它不是最好的。如果你想要简单那就有。这是可以做到的。

我认为这只适用于 solr 5+。

$ bin/solr create -c corename
$ bin/post -c corename https://siteurl.com -recursive 2 -delay 1

This would do a basic index of the site but it would not be the best. If you want simple then there it is. It can be done.

I think this only works on solr 5+.

奈何桥上唱咆哮 2024-09-01 15:51:35

您可能需要查看的另外两个选项是 Crawl AnywhereHeritrix

Two other options you might want to look at are Crawl Anywhere and Heritrix

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文