当查询包含在包含空格分隔的单词的引号中时,Solr 的部分搜索不起作用
这是我的搜索查询:
name_text_partial_all:"hello world"
该字段在一个文档的索引中包含以下单词: hello world
这是我对此类型的架构定义:
<fieldtype class="solr.TextField" name="text_partial_all" positionIncrementGap="100" omitNorms="false" stored="false">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PatternReplaceFilterFactory" pattern="[^\d\sa-zA-Z]" replacement=""/>
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="30"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PatternReplaceFilterFactory" pattern="[^\d\sa-zA-Z]" replacement=""/>
<filter class="solr.LengthFilterFactory" min="2" max="30" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StandardFilterFactory"/>
</analyzer>
</fieldtype>
这不是查找文档。有什么线索吗?
Here's my search query:
name_text_partial_all:"hello world"
The field has these words in the index for one document: hello world
Here's my schema definition for this type:
<fieldtype class="solr.TextField" name="text_partial_all" positionIncrementGap="100" omitNorms="false" stored="false">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PatternReplaceFilterFactory" pattern="[^\d\sa-zA-Z]" replacement=""/>
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="30"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PatternReplaceFilterFactory" pattern="[^\d\sa-zA-Z]" replacement=""/>
<filter class="solr.LengthFilterFactory" min="2" max="30" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StandardFilterFactory"/>
</analyzer>
</fieldtype>
This is not finding the document. Any clue why?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
将生成位于不同位置的 ngram 标记。例如,Hello World 当它通过 NGramFilterFactory 时,标记 Hello 和 World 将位于不同的位置。
您可以检查对 Hello World 的分析,标记 Hello 位于位置 10,world 位于位置 20。
因此,查找精确短语
name_text_partial_all:"hello world"
的查询将无法工作,而name_text_partial_all:"hello world"~9
则可以工作。您需要使用斜率或位置过滤器来保持相同的位置。
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="30"/>
will generate ngram tokens which would be at separate positions.For e.g. Hello World when it goes through the NGramFilterFactory the tokens Hello and World would be at separate positions.
You can check on analysis for the Hello World, the tokens Hello is at position 10 and world is at position 20.
So a query looking for exact phrase
name_text_partial_all:"hello world"
would not work whilename_text_partial_all:"hello world"~9
would work.You need to either use slop or position filter to maintain the same positions.