当前位置：文江博客话题详情

Lucene performance search lucene.net

Lucene (.NET) 文档结构和性能建议

发布于 2024-09-01 20:01:46 字数 490 浏览 1 评论 0原文

我正在索引大约 100M 个文档，这些文档由一些字符串标识符和一百个左右的数字术语组成。我不会进行范围查询，所以我没有深入研究数字字段，但我不认为它是选择这里就对了。

我的问题是，当我开始向查询中添加 OR 条件时，查询性能会迅速下降。我的所有查询都基于特定的数字术语。所以文档看起来像 StringField:[someString] 和 N DataField:[someNumber] ..我然后使用类似 DataField:((+1 +(2 3)) (+75 +(3 5 52)) (+99 +88 +(102 155 199))) 的内容进行查询。

目前，这些查询在我的笔记本电脑上运行大约需要 7 到 16 秒。我想确保这确实是他们能做的最好的事情。我愿意接受有关字段结构和查询结构的建议:-)。

谢谢

Josh

PS：我已经阅读了这里、Lucene wiki 和 lucid imiagination 上所有其他 lucene 性能讨论...我在兔子洞里走得更远了...

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

黑白记忆 2024-09-08 20:01:46

既然您提到您正在执行特定数字查询而不是范围查询，那么我不会建议您查看 Lucene 3.0 中的真正快速的数字范围查询。

根据你的描述，我认为得分是造成问题的原因。当您有如此多的嵌套布尔查询时，评分会变得越来越复杂。而且分数是浮点数，运算速度较慢。如果您不关心分数，请编写自定义收集器是个好主意。您可以查看我链接的 javadoc 中的示例，以编写您自己的示例。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

初遇

文章 0 评论 0

听闻余生

文章 0 评论 0

Z_dy

文章 0 评论 0

左岸枫

文章 0 评论 0

1848719402

文章 0 评论 0

婷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文