Solr 突出显示没有短语的停用词?

发布于 2024-10-12 06:34:44 字数 233 浏览 4 评论 0 原文

我正在尝试在 Solr 中突出显示结果,到目前为止,到处调整都是很困难的...我现在主要关心的是我让突出显示短语工作正常,但如果我搜索类似的内容 “巴西世界杯:意外的挑战”

突出显示字段将返回: “巴西世界杯:意外的挑战”

我认为这可能是由于停用词造成的(顺便说一句,我的字段是“textgen”类型)。是否有某种参数可以在查询中运行,该参数会按预期返回突出显示的整个字段?或者我是否必须删除文本生成中的停用词过滤器?

I am trying to highlight results in Solr and up until now, it's been a struggle of tweaking here and there... My main concern now is that i got the highlighting phrases thing working, but if i search for something like
"The World Cup At Brazil: An Unexpected Challenge"

The highlighting field will return:
"World Cup Brazil: Unexpected Challenge"

I think this might be due to the stop words (my field is a 'textgen' type, btw). Is there some kind of parameter to run in the query that would return the entire field highlighted as expected? Or will i have to remove the stopwords filter in the textgen?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

枫林﹌晚霞¤ 2024-10-19 06:34:44

这肯定是由于停用词造成的。考虑声明一个新的字段类型,例如 textgen,但在其索引或查询分析器中没有以下内容:

 /> 

This is definitely due to stopwords. Consider declaring a new fieldtype like textgen, but without the following in it's index or query analyzers:

    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" /> 
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文