当前位置：文江博客话题详情

如何使用 NGramTokenizerFactory 或 NGramFilterFactory？

发布于 2024-10-11 10:45:59 字数 328 浏览 8 评论 0原文

最近在研究如何使用Solr进行存储和索引。我想做facet.prefix 搜索。使用空格标记器，“你在哪里”将被分成三个单词并建立索引。如果我搜索facet.prefix =“where are”，则不会返回任何结果。

我谷歌发现 NGramFilterFactory 可以帮助我。但是当我应用这个过滤器工厂时，我发现结果是“w，h，e，...，wh，..”，它按字符而不是按标记词分割句子。

我使用参数 maxGramSize 和 minGramSize，设置为 1 和 3。NGramFilterFactory 工作正常吗？我应该添加一些其他参数吗？还有其他过滤器工厂可以帮助我吗？

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冷夜 2024-10-18 10:45:59

Facet 只能应用于非标记化字段，例如字符串。如果您希望显示“是什么”的结果，则对该字段（或 copyField 指令）根本不使用标记器。我猜您想使用facet.prefix 进行自动补全。你可以这样做，看看在这里。

对于 ngramtokenizer 看看这个。

回复收藏 0 原文

~没有更多了~

关于作者

情独悲

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

如何使用 NGramTokenizerFactory 或 NGramFilterFactory？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

如何使用 NGramTokenizerFactory 或 NGramFilterFactory？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。