Lucene

Lucene

文章 59 浏览 324

优化 PDF Word 搜索

我有一个应用程序,它迭代 pdf 文件的目录并搜索字符串。我正在使用 PDFBox 从 PDF 中提取文本,代码非常简单。起初,要搜索 13 个文件,需要一分半钟…

别理我 2024-12-09 18:38:31 1 0

如何独立使用 solr.analysis.WordDelimiterFilter

在这一点上,我很确定我已经搜索了足够多的内容,但我找不到一个很好的例子来说明如何使用这门课。 我一直在寻找一组好的分词器,当然 solr/lucene 集…

小帐篷 2024-12-09 15:36:49 1 0

Lucene中的BlockJoinQuery是否适合搜索有片段的文档(父子关系)

我正在使用 Lucene 来索引由片段组成的文档。 整个文档由描述它的字段组成(即作者、标题、发布日期)。 片段包含文本和标签(关键字)。我希望能够:…

微凉徒眸意 2024-12-09 11:43:09 1 0

Lucene索引服务

我们希望在 J2EE Web 应用程序中使用 lucene。我们想要为 Lucene 相关功能(如索引写入/搜索文档)创建单独的 lucene 服务(将部署在单独的 JBOSS 服…

半步萧音过轻尘 2024-12-09 11:03:33 1 0

Solr排序性能问题

我试图在查询中对字符串字段指定排序,但看到内存问题,因为索引有大约 50M 文档。 为什么 Solr 实际上对索引中所有文档的字段值进行排序,而不仅仅是…

萌酱 2024-12-09 08:02:34 1 0

在 Lucene 中使用 XML 字段进行邻近搜索

我有一个如下所示的文档语料库: text sample text text words lipsum words words text some other text 我希望能够搜索注释中一定数量的标记中出现…

月寒剑心 2024-12-09 07:45:15 1 0

Lucene:找不到符号

我正在使用 Lucene 3.4.0、hibernate (hibernate-all.jar)、ANT 和 TestNG 来运行一些测试... 现在大多数工作都有效,但是由于我已经实现了 lucene 部…

梦里梦着梦中梦 2024-12-09 06:10:08 2 0

Lucene:复制(FS)目录实现

Lucene 的 (FS)Directory 是否有任何替代实现,特别是与复制相关的实现?我期待做的事情(但在实现我自己的之前寻找现有的东西:)是一个同时写入多个相…

夜无邪 2024-12-09 06:05:48 1 0

lucene布尔搜索

我想知道 lucene 如何查找与 boolean 匹配的文档像这样的查询:“+a + b c”,我的意思是它的算法是什么? 谢谢…

你不是我要的菜∠ 2024-12-09 04:30:38 3 0

Solr 在新字段上没有搜索结果

我向 schema.xml 添加了一个多值字段,如下所示: 当我搜索文档内容时,我得到以下结果: 33 52 所以我确信 fieldsharedchannelnew 在结果 中我进行以…

稀香 2024-12-09 04:09:45 1 0

Apache lucene 和文本含义

我有一个关于 lucene/ 中搜索过程的问题。 我使用此代码进行搜索 Directory directory = FSDirectory.GetDirectory(@"c:\index"); Analyzer analyzer …

肤浅与狂妄 2024-12-09 03:20:34 1 0

android lucene中的问题

我是 android 和 Lucene 的新手。 我想知道我是否可以使用lucene在android列表视图中进行搜索。 我尝试导入包 2.3.2 并使用库中的 jar 文件。 但是,S…

时常饿 2024-12-09 02:42:10 1 0

关于使用 Lucene 进行架构的建议?

我只是想知道我应该如何在应用程序中构建 Lucene 上下文,是否走在正确的轨道上: 创建一个将创建编写器实例的单例类。 每次需要读取索引时构造一个读…

枕头说它不想醒 2024-12-08 23:49:21 1 0

使用 Lucene 进行个性化搜索

我想询问有关个性化搜索的问题。我即将使用 Lucene 设计/实现个性化搜索。我对此做了一些谷歌搜索,但似乎没有找到可以与 Lucene 一起使用的模块/工具…

川水往事 2024-12-08 21:02:05 1 0

如何增强solr中的字段

我已经事先确定了提升。我的 solr 索引中有一个名为 boost1 的字段。该提升字段的值介于 1 到 10 之间,类似于 google PR 排名。这是应该应用于 solr …

是你 2024-12-08 18:24:19 1 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文