Lucene搜索速度过慢
最近用Lucene的最新版本,具体是这样的:1000W数据,64G大小,分盘储存,然后合并搜索,standar分词,三个域,其中内容域为网页爬虫采集的HTML(去掉了标签)所以索引文件略大。
现在搜索标题保持在1S以内,但是初次搜索速度略慢。重要的是内容更慢,第一次搜索会超过十秒以上,而后都是超过3秒以上,很蛋疼啊。
求各位大大的优化建议..
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
+1,需要
楼主,内存够大吗?试试把索引全部装到内存去。用那个 RAMDirectory 。这样一搜索,第一次就把全部索引装进去了不用预热。
我现在是通配查询有瓶颈,不知道怎么改进。
2g索引,要实现数据库的 like '管理%' 这样的一个操作。我用的是 WildcardQuery,创建索引的时候这个字段不分词。
大概想实现的类似百度搜索的关键字推荐,比如你输入 会计 ,下拉马上出现会计开头的关键字。
楼主能回回我的么