通过solr读取分布式lucene索引
我将用下图解释我的问题陈述。 我有 4 台机器,每台机器都运行我的应用程序的实例,该应用程序使用 lucene 进行搜索。这意味着 lucene 索引已在所有 4…
通过 lucene 使用预标记化文本
我的数据已经使用外部资源标记化,我想在 lucene 中使用该数据。我的第一个想法是使用 \x01 连接这些字符串,并使用 WhiteSpaceTokenizer 再次拆分它…
启用 Jackrabbit 的搜索索引时出现 NullPointerException
我目前正在开发积极使用 Jackrabbit 的应用程序。这是我第一次接触长耳大野兔。我使用基于 h2 的配置进行 junit 测试。 Lucene 搜索在我的repository.…
使用 dismax 搜索多字索引术语
我的 solr 架构如下(仅重要部分):
按最近在 Lucene / Solr 中的访问排序
在我的 Solr 查询中,我想将最近访问的文档排序到顶部(“访问”意味着由用户操作打开)。没有其他搜索条件对我来说很重要:在文本与查询匹配的文档中…
为什么必须在长查询字符串中的每个数字之间添加 OR?
通常,当您查询字符串时,Solr 会对所有内容进行标记,并毫无问题地找到文档中的所有单词匹配。然而,我遇到了一个有趣的问题,我花了几个小时才弄清…
Java 程序使用或覆盖已弃用的 API?
我编写了一个程序,在 Netbeans 和 Eclipse 中编译和运行没有任何问题。但是当我尝试通过以下方式在命令行中编译它时: javac -classpath .:lucene-co…
为什么这个 lucene 查询字符串是错误的?
好吧,当我想对我的 lucene 索引进行一些查询时,我发现了一个问题: +(title:a^4.0) +((+type:restaurant +city:CA) (-type:restaurant)) 我只想限制…
从列表中识别文档中是否存在关键字
我想根据预先确定的列表为 Lucene 文档创建标签列表。 因此,如果我们有一个文档,其文本为 寻找具有 Lucene 经验的 Java 程序员, 并且我们有关键字…
当查询包含在包含空格分隔的单词的引号中时,Solr 的部分搜索不起作用
这是我的搜索查询: name_text_partial_all:"hello world" 该字段在一个文档的索引中包含以下单词: hello world 这是我对此类型的架构定义: 这不是…
在 Lucene.Net 索引中搜索 url 字段
我想在 Lucene.net 索引中搜索存储的 url 字段。我的代码如下: Field urlField = new Field("Url", url.ToLower(), Field.Store.YES,Field.Index.TOK…
在 Lucene 搜索结果中查找项目位置的最佳方法
我正在使用 Lucene.NET,并且能够搜索并获得 ScoreDoc[] 形式的命中结果。 我需要知道 ScoreDoc[] 中的具体项目位置。 ScoreDoc[] 中的所有项目都是唯…