SOLR 中的 EdgeNGramTokenizerFactory EdgeNGramFilterFactory 有什么区别?
这两种过滤器有什么区别? 它们的效果好像是一样的?
谁能提供一个例子来说明如何将它们应用于某些文本?
What is the difference between these two filters?
They seem to have the same effect?
Can anyone supply an example of how they are applied to some text?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
好吧,第一个提供了一个
Tokenizer
,第二个提供了一个Filter
;-)由于只能有一个 Tokenizer,EdgeNGramTokenizerFactory 仅对包含单个单词的字段有用。如果您想将为文档提供的字符串分隔为单词,则首先需要一个不同的 Tokenizer,它会根据空格或其他内容进行拆分,然后再需要 EdgeNGramFilterFactory。
Well, the first provides a
Tokenizer
, the second provides aFilter
;-)Since you can have only one Tokenizer, EdgeNGramTokenizerFactory is only useful for fields containing a single word. If you want to separate the string you provide for your documents into words, you'll need a different Tokenizer first, which splits on whitespace or something, and the EdgeNGramFilterFactory afterwards.