Lucene - 如何丢弃索引中的数字术语?

发布于 2024-10-15 09:59:10 字数 213 浏览 2 评论 0原文


使用 StandardAnalyzer,我的 Lucene 也包含数字术语(即“200”) ”)。所以我的索引中的术语数量太大。
有谁知道是否存在丢弃数字项的分析器或分词器?
如果没有的话有什么简单的方法可以得到吗?

Using StandardAnalyzer, my Lucene contain numeric terms too(i.e. "200"). So number of term in my index is too big.
Does anyone know if exists an Analyzer or Tokenizer that discards numeric terms?
If not, is there any easy way to get it?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

浪漫人生路 2024-10-22 09:59:10

安东尼奥,我建议你尝试使用 SimpleAnalyzer< /a>.

如果这对您不起作用,您可能必须编写自己的分析器。

Antonio, I suggest you try using SimpleAnalyzer.

If this does not work for you, you may have to write your own analyzer.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文