lucene荧光笔:如何获取片段的位置?

发布于 2024-12-21 09:26:55 字数 282 浏览 1 评论 0原文

我知道如何使用 Lucene 荧光笔获取相关突出显示的片段以及一些周围的文本,即使用

Highlighter highlighter = new Highlighter(scorer);
String[] fragments = highlighter.getBestFragments(stream, fieldContents, fragmentNumber);

但是我可以在原始内容中获取指向这些片段的指针吗?换句话说,我需要知道这些片段从哪里开始,如果可能的话,从哪里结束。

I know how to get relevant highlighted fragments together with some surrounding text using Lucene highlighter, namely, using

Highlighter highlighter = new Highlighter(scorer);
String[] fragments = highlighter.getBestFragments(stream, fieldContents, fragmentNumber);

But can I instead get pointers to these fragments in the original contents? In other words, I need to know where these fragments start and, if possible, end.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

伴随着你 2024-12-28 09:26:55

如果您改用 GetBestTextFragments 方法,您将返回一个 TextFragment 数组。它们具有属性 textStartPostextEndPos

(它们在 Lucene.NET 中被标记为内部,这将要求您进行一些代码更改才能访问它们。我不确定 Java Lucene。)

If you use the GetBestTextFragments method instead, you will get back an array of TextFragments. These have properties textStartPos and textEndPos.

(They are marked internal in Lucene.NET, which will require you to make some code changes to get access to them. I'm not sure about Java Lucene.)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文