lucene荧光笔:如何获取片段的位置?
我知道如何使用 Lucene 荧光笔获取相关突出显示的片段以及一些周围的文本,即使用
Highlighter highlighter = new Highlighter(scorer);
String[] fragments = highlighter.getBestFragments(stream, fieldContents, fragmentNumber);
但是我可以在原始内容中获取指向这些片段的指针吗?换句话说,我需要知道这些片段从哪里开始,如果可能的话,从哪里结束。
I know how to get relevant highlighted fragments together with some surrounding text using Lucene highlighter, namely, using
Highlighter highlighter = new Highlighter(scorer);
String[] fragments = highlighter.getBestFragments(stream, fieldContents, fragmentNumber);
But can I instead get pointers to these fragments in the original contents? In other words, I need to know where these fragments start and, if possible, end.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果您改用
GetBestTextFragments
方法,您将返回一个TextFragment
数组。它们具有属性textStartPos
和textEndPos
。(它们在 Lucene.NET 中被标记为内部,这将要求您进行一些代码更改才能访问它们。我不确定 Java Lucene。)
If you use the
GetBestTextFragments
method instead, you will get back an array ofTextFragment
s. These have propertiestextStartPos
andtextEndPos
.(They are marked internal in Lucene.NET, which will require you to make some code changes to get access to them. I'm not sure about Java Lucene.)