如何在不调用incrementToken()的情况下查看Lucene StandardTokenizer是否有令牌
我只需要知道标记输入的结果是否会产生任何标记,如果效果很好,如果没有,我确实需要以另一种方式进行标记。如果它确实有一些令牌调用 incToken() 会破坏一些东西,那么我就必须在不需要的时候重新标记它,因为第一次没问题,我该如何解决这个问题?
I just need to know if the results of tokenzing input results in any tokens, if it does fine, if it doesn't I do need to tokenize in another way. Trouble if it does have some tokens calling incToken() breaks things so that then I have to retokenize it when I shouldnt need to because it was okay the first time, how do I get round this ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
只需使用
incrementToken
然后reset
。Just use
incrementToken
thenreset
.