SOLR 中的 EdgeNGramTokenizerFactory EdgeNGramFilterFactory 有什么区别?

发布于 2024-09-06 12:50:56 字数 65 浏览 6 评论 0原文

这两种过滤器有什么区别? 它们的效果好像是一样的?

谁能提供一个例子来说明如何将它们应用于某些文本?

What is the difference between these two filters?
They seem to have the same effect?

Can anyone supply an example of how they are applied to some text?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

只想待在家 2024-09-13 12:50:56

好吧,第一个提供了一个 Tokenizer,第二个提供了一个 Filter ;-)

由于只能有一个 Tokenizer,EdgeNGramTokenizerFactory 仅对包含单个单词的字段有用。如果您想将为文档提供的字符串分隔为单词,则首先需要一个不同的 Tokenizer,它会根据空格或其他内容进行拆分,然后再需要 EdgeNGramFilterFactory。

Well, the first provides a Tokenizer, the second provides a Filter ;-)

Since you can have only one Tokenizer, EdgeNGramTokenizerFactory is only useful for fields containing a single word. If you want to separate the string you provide for your documents into words, you'll need a different Tokenizer first, which splits on whitespace or something, and the EdgeNGramFilterFactory afterwards.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文