如何在使用 Solr/Lucene 时放弃低于特定分数的点击？

发布于 2025-01-04 05:39:28 字数 706 浏览 2 评论 0原文

我的问题是，搜索只是我的应用程序的一个小补充，我真的不想投入太多时间来深入研究整个想法。看看我的搜索结果 - 这是一种非常常见的模式，我得到一些非常好的匹配（7+）和一些非常非常糟糕的匹配，女巫得分约为 0.10。如果我想使用分数以外的任何其他标准对结果进行排序，那么它就没有什么意义，因为 0.10 几乎与查询无关，并且可能最终出现在列表中的第一个。

说真的，看起来将所有分数都削减到 3 左右会让我的结果更加一致，排序也会更有意义。

现在，在做了一些基础研究之后，看起来很多人都认为，按分数过滤 Solr 结果确实是个坏主意。关于如何做到这一点有一些建议，但我还没有找到可行的解决方案。

使用 frange （在正确的 q 查询或 qf 上）的建议想法并没有真正起作用。放弃应用程序本身的低分结果似乎也很乏味，因为它会破坏分页，减慢速度，并且通常会产生许多不必要的工作。

在 Google 上大约一个小时后，我发现很多人真的想要这个解决方案，尽管我找不到任何适合我的东西。

那么，有什么办法可以放弃 solr 方面的低分结果吗？有没有自定义过滤器可以做到这一点？

编辑：

由于某种原因，大部分结果在底部都有显着的分数差距。例如，最后一个相关结果的得分为 4.5，并且总是有一些结果，下一个最高的结果为 0.12...也许我在索引级别上做错了什么？有没有什么简单的方法可以将那些不相关的结果从结果哈希中推下来？经过更多的研究后，看起来我在放弃 < 后会变得更不好。 1 分...

原文

分享到QQ

分享到微博