这个“^”在 solr 中意味着什么

发布于 2024-12-17 15:25:08 字数 475 浏览 0 评论 0原文

我让她感到困惑,但我想消除我的疑虑。我认为这是一个愚蠢的问题,但我想知道。 使用 TokenFilter 为每个输入令牌输出两个令牌(一个原始的,一个小写的)。对于查询,客户端需要将包含大写字符的任何搜索词扩展为两个词,一个是小写字符,一个是原始字符。原始搜索词可能会得到提升,尽管这可能没有必要,因为两个词的匹配都会产生更高的分数。

text:NeXT ==> (text:NeXT^10 OR text:next)

这个 ^ 在这里意味着什么。

http://wiki.apache.org/solr/SolrRelevancyCookbook#Relevancy_and_Case_Matching

I am confuse her but i want to clear my doubt. I think it is stupid question but i want to know.
Use a TokenFilter that outputs two tokens (one original and one lowercased) for each input token. For queries, the client would need to expand any search terms containing upper case characters to two terms, one lowercased and one original. The original search term may be given a boost, although it may not be necessary given that a match on both terms will produce a higher score.

text:NeXT ==> (text:NeXT^10 OR text:next)

what this ^ mean here .

http://wiki.apache.org/solr/SolrRelevancyCookbook#Relevancy_and_Case_Matching

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

╭ゆ眷念 2024-12-24 15:25:08

与此查询中的 next 相比,这提高了 NeXT 的值(使其更加重要)。从您链接到的 wiki 页面“原始搜索词可能会得到提升,尽管这可能没有必要,因为两个术语的匹配都会产生更高的分数。”

有关提升的更多信息,请请参阅 提升排名条款 部分。 href="http://wiki.apache.org/solr/SolrRelevancyCookbook" rel="nofollow">Solr 相关性指南。这个幻灯片关于今年早些时候 Lucene Revolution Conference 上的 Boosting 还包含有关 boosting 如何工作的良好信息以及如何将其应用到各种场景中。

编辑1:
有关 boost 值(^ 后面的数字)的更多信息,请参阅以下内容:

编辑2:
提升的值会影响从搜索结果返回的项目的分数/相关性。

  1. (term:NeXT^10 term:next) - 任何与 term:NeXT 匹配的文档在此查询中都会获得更高/更相关的分数,因为它们应用了 10 的提升值。
  2. (term:NeXT^10 term:Next^5 term:next) - 任何匹配 term:NeXT 的文档都将获得最高分(因为提升值最高),任何匹配 term:Next 的文档的得分将低于 term:NeXT,但高于 term:next

This is giving a boost (making it more important) to the value NeXT versus next in this query. From the wiki page you linked to "The original search term may be given a boost, although it may not be necessary given that a match on both terms will produce a higher score."

For more on Boosting please see the Boosting Ranking Terms section in your the Solr Relevancy Cookbook. This Slide Deck about Boosting from the Lucene Revolution Conference earlier this year, also contains good information on how boosting works and how to apply it to various scenarios.

Edit1:
For more information on the boost values (the number after the ^), please refer to the following:

Edit2:
The value of the boost influences the score/relevancy of an item returned from the search results.

  1. (term:NeXT^10 term:next) - Any documents matching term:NeXT will be scored higher/more relevant in this query because they have a boost value of 10 applied.
  2. (term:NeXT^10 term:Next^5 term:next) - Any documents matching term:NeXT will be scored the highest (because of highest boost value), any documents matching term:Next will be scored lower than term:NeXT, but higher than term:next.
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文