这个“^”在 solr 中意味着什么

发布于 2024-12-17 15:25:08 字数 475 浏览 0 评论 0原文

我让她感到困惑，但我想消除我的疑虑。我认为这是一个愚蠢的问题，但我想知道。使用 TokenFilter 为每个输入令牌输出两个令牌（一个原始的，一个小写的）。对于查询，客户端需要将包含大写字符的任何搜索词扩展为两个词，一个是小写字符，一个是原始字符。原始搜索词可能会得到提升，尽管这可能没有必要，因为两个词的匹配都会产生更高的分数。

text:NeXT ==> (text:NeXT^10 OR text:next)

这个 ^ 在这里意味着什么。

http://wiki.apache.org/solr/SolrRelevancyCookbook#Relevancy_and_Case_Matching

原文

I am confuse her but i want to clear my doubt. I think it is stupid question but i want to know.
Use a TokenFilter that outputs two tokens (one original and one lowercased) for each input token. For queries, the client would need to expand any search terms containing upper case characters to two terms, one lowercased and one original. The original search term may be given a boost, although it may not be necessary given that a match on both terms will produce a higher score.

text:NeXT ==> (text:NeXT^10 OR text:next)

what this ^ mean here .

http://wiki.apache.org/solr/SolrRelevancyCookbook#Relevancy_and_Case_Matching

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

╭ゆ眷念 2024-12-24 15:25:08

与此查询中的 next 相比，这提高了 NeXT 的值（使其更加重要）。从您链接到的 wiki 页面“原始搜索词可能会得到提升，尽管这可能没有必要，因为两个术语的匹配都会产生更高的分数。”

有关提升的更多信息，请请参阅提升排名条款部分。 href="http://wiki.apache.org/solr/SolrRelevancyCookbook" rel="nofollow">Solr 相关性指南。这个幻灯片关于今年早些时候 Lucene Revolution Conference 上的 Boosting 还包含有关 boosting 如何工作的良好信息以及如何将其应用到各种场景中。

编辑1：
有关 boost 值（^ 后面的数字）的更多信息，请参阅以下内容：

编辑2：
提升的值会影响从搜索结果返回的项目的分数/相关性。

(term:NeXT^10 term:next) - 任何与 term:NeXT 匹配的文档在此查询中都会获得更高/更相关的分数，因为它们应用了 10 的提升值。
(term:NeXT^10 term:Next^5 term:next) - 任何匹配 term:NeXT 的文档都将获得最高分（因为提升值最高），任何匹配 term:Next 的文档的得分将低于 term:NeXT，但高于 term:next。