在 Lucene.NET 中过滤排序查询的结果

发布于 2024-11-16 21:38:26 字数 455 浏览 3 评论 0原文

我正在使用 Lucene.NET，它目前是最新的 Lucene 2.9。我正在尝试实现一种不同的选择，但不需要深入到任何组。我知道 Lucene 3.2 有一个分面搜索可以解决这个问题，但我还没有时间将它移植到 2.9。

我认为无论如何，当您使用排序运算符执行分页查询时，Lucene 必须找到与查询匹配的所有文档，对它们进行排序，然后获取前 N 个结果，其中 N 是页面大小。我想构建一些在排序查询完成后也应用的东西，但获取前 N 个唯一结果并返回它们。我正在考虑使用 HashSet 和索引字段之一来确定唯一性。我宁愿找到一种方法来扩展 Lucene 中的某些内容，也不愿在出于性能原因返回结果后尝试执行此操作。

自定义过滤器似乎在应用主查询之前运行，并且自定义收集器在应用排序之前运行，除非您按 Lucene 的文档 ID 排序。那么解决这个问题的最佳方法是什么？指向要扩展的正确组件的方向的一点将为您提供这个问题的答案，示例实现肯定会为您提供答案。提前致谢

原文

分享到QQ

分享到微博