Lucene搜索速度过慢

发布于 2021-12-04 22:38:25 字数 201 浏览 935 评论 2

最近用Lucene的最新版本,具体是这样的:1000W数据,64G大小,分盘储存,然后合并搜索,standar分词,三个域,其中内容域为网页爬虫采集的HTML(去掉了标签)所以索引文件略大。

现在搜索标题保持在1S以内,但是初次搜索速度略慢。重要的是内容更慢,第一次搜索会超过十秒以上,而后都是超过3秒以上,很蛋疼啊。

求各位大大的优化建议..

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

凌乱心跳 2021-12-07 13:59:44

+1,需要

做个少女永远怀春 2021-12-06 19:55:17

楼主,内存够大吗?试试把索引全部装到内存去。用那个 RAMDirectory 。这样一搜索,第一次就把全部索引装进去了不用预热。

我现在是通配查询有瓶颈,不知道怎么改进。

2g索引,要实现数据库的 like '管理%' 这样的一个操作。我用的是 WildcardQuery,创建索引的时候这个字段不分词。

大概想实现的类似百度搜索的关键字推荐,比如你输入 会计 ,下拉马上出现会计开头的关键字。

楼主能回回我的么

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文