Lucene:使用 PrefixQuery 进行分数计算
我在使用 PrefixQuery 进行分数计算时遇到问题。为了更改每个文档的分数,当将文档添加到索引中时,我使用 setBoost 来更改文档的提升。然后我创建Pre…
使用过多子句时 Lucene.Net 内存消耗和搜索速度变慢
我有一个具有文本文件属性和文本文件主键 ID 的数据库, 索引了大约 100 万个文本文件及其 ID(数据库中的主键)。 现在,我正在两个层面上寻找。 首…
有没有办法可以向 Lucene.NET 提供预定义的相关术语列表?
我知道我可以在搜索过程中为术语指定“提升因子”,如 中所述http://lucene.apache.org/java/2_4_0/queryparsersyntax.html。 我的问题是:我可以为 L…
使用 Lucene.Net 进行多词自动建议
我目前正在开发一个搜索应用程序,它使用 Lucene.Net 将数据库中的数据索引到索引文件。我有一个产品目录,其中包含名称、短描述和长描述、sku 和其他…
Lucene.NET 2.9 和 BitArray/DocIdSet
我发现了一个关于在基本查询上获取构面计数的很好的例子。它存储基本查询的位数组,以提高每次计算分面时的性能。 var genreQuery = new TermQuery(ne…
Lucene 搜索花费太长时间
我正在(当前)70Gig 索引上使用 Lucene.net (2.9.2.2)。我可以进行相当复杂的搜索,并在 1 ~ 2 秒内获取所有文档 ID。但要实际加载所有命中(在我的…
Lucene.net 2.9.2 NumericField排序
谁能验证最新的 Lucene.net 2.9.2 是否可以对 NumericField 进行排序(和反向排序)?我有点困惑,特别是反向排序:(…
如何索引像“aaa.bbb.ddd-fff”这样的字符串在卢塞恩?
我必须索引很多包含参考号的文档,例如“aaa.bbb.ddd-fff”。结构可以更改,但它始终是一些任意数字或字符与“/”、“-”、“_”或其他分隔符的组合。…
我的 Lucene 查询只找到一次命中
我正在开始使用 Lucene.Net(停留在版本 2.3.1 上)。我用这个添加示例文档: Dim indexWriter = New IndexWriter(indexDir, New Standard.StandardAn…
将通配符查询设置为 QueryParser 的默认值
当我的用户输入“word”这样的术语时,我希望将其视为通配符查询“word*”,以便找到以“word”开头的所有术语。有没有办法告诉 QueryParser 自动创建…
用于从 Open XML 文件格式中提取纯文本的 ASP.NET 库
是否有一个预先存在的库可以从 Open XML 文件格式(例如 docx、pptx 和 xlsx)文件中提取纯文本? 我需要它来填充 lucene.net 索引。 我找到了这个 从…