Lucene - 如何丢弃索引中的数字术语?
使用 StandardAnalyzer,我的 Lucene 也包含数字术语(即“200”) ”)。所以我的索引中的术语数量太大。
有谁知道是否存在丢弃数字项的分析器或分词器?
如果没有的话有什么简单的方法可以得到吗?
Using StandardAnalyzer, my Lucene contain numeric terms too(i.e. "200"). So number of term in my index is too big.
Does anyone know if exists an Analyzer or Tokenizer that discards numeric terms?
If not, is there any easy way to get it?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
安东尼奥,我建议你尝试使用 SimpleAnalyzer< /a>.
如果这对您不起作用,您可能必须编写自己的分析器。
Antonio, I suggest you try using SimpleAnalyzer.
If this does not work for you, you may have to write your own analyzer.