lucene vs solr 评分
有人可以用更简单的语言解释(或引用参考文献)来比较 SOLR 和 LUCENE 使用的评分机制吗? 它们有什么区别吗?
我不太擅长 solr/lucene 但我的发现表明它们似乎是不同的。
PS:我只是尝试了一个简单的查询,例如“+Contents:risk”,并且没有使用任何过滤器其他内容。
Can some one explain (or quote a reference) to compare the scoring mechanism used by SOLR and LUCENE in simpler words.
Is there any difference in them;
I am not that good at solr/lucene but my finding showed as if they are different.
P.S: i just tries a simple query like "+Contents:risk" and didn't use any filter other stuff.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
Lucene 使用向量空间模型中的概念来计算文档的分数。总之,查询和文档可以看作向量。为了计算特定查询的文档得分,Lucene 会计算每个文档的向量与查询向量的接近程度。文档在 VSM 中距离查询越近,得分就越高。您可以通过查看 Lucene 的 来了解更多详细信息相似类和Lucene的评分文档。
Lucene uses concepts from the Vector space model to compute the score of documents. In summary, queries and documents can be seen as vectors. To compute the score of a document for a particular query, Lucene calculates how near each document's vector are from the query's vector. The more a document is near the query in VSM, the higher the score. You can have more details by looking at Lucene's Similarity class and Lucene's Scoring document.
实际的公式可以在相似度中找到javadoc。
这里是所涉及参数的摘要及其含义的简要说明。
Solr 在底层使用 Lucene,默认情况下 Solr 使用默认的 Lucene 相似度算法。
The actual formula can be found in the Similarity javadocs.
Here's a summary of the parameters involved and a brief description of what they mean.
Solr uses Lucene under the hood, and by default Solr uses the default Lucene similarity algorithm.