当前位置：文江博客话题详情

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）

发布于 2024-12-17 11:11:24 字数 251 浏览 0 评论 0原文

我有一个包含许多条目的 Solr 索引，并且在查询时返回一些子集 - 每个条目都有一些分数（显而易见）。一旦结果与分数一起返回，我希望能够仅“保留”高于某个分数的结果（即仅具有特定质量的结果）。当返回的子集可以是任何东西时是否可以这样做？

我问这个问题是因为在某些查询中，0.008 的分数似乎会导致良好的匹配，而其他查询则较高的分数会导致较差的匹配。

理想情况下，我只是在寻找一种方法来获取前 x 条目，只要它们至少具有一定的质量。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

与往事干杯 2024-12-24 11:11:24

我认为你不应该这样做。使用 TF-IDF 评分模型，无法计算出高于该分数的所有结果都相关的分数，反之亦然。如果您设法做到这一点，那么在对索引进行几次更新后，该阈值很可能将不再有效（因为文档频率会发生变化）。

如果您仍然想这样做，我认为可以使用函数查询来实现：Solr 中有一个 if （在主干中）和一个 query 函数。只需过滤您的结果，以便仅保留分数高于给定阈值的条目。

回复收藏 0 原文

比忠 2024-12-24 11:11:24

还想先浏览 ScoresAsPercentages 。

Solr 不会标准化分数，因为它可以在客户端轻松完成。
您可以使用结果中提供的 maxScore，将所有分数除以
最大分数。
第一个记录的得分为 1，然后是其余记录。

回复收藏 0 原文

~没有更多了~

关于作者

鱼窥荷

暂无简介

0 文章

0 评论

22 人气

关注发私信

友情链接

文江博客

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

╭⌒浅淡时光〆

慕巷

浅生活

bal

lqwuliang

后来的我们

友情链接

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？ （即 Solr 评分是否以任何方式标准化）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

╭⌒浅淡时光〆

慕巷

浅生活

bal

lqwuliang

后来的我们

友情链接

是否可以“合理”地设置 Solr 分数阈值，而与返回的结果无关？（即 Solr 评分是否以任何方式标准化）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。