Apache Solr 能否处理 TB 大数据
我是 apache solr 用户大约一年了。我使用 solr 作为简单的搜索工具,但现在我想使用 solr 处理 5TB 的数据。我假设当 solr 根据我使用的过滤器对其进…
lucene 索引期间 JVM 不断崩溃
JVM 不断崩溃。我无法弄清楚问题是什么。我用最新的1.6 jdk以及1.7进行了测试。同样的问题。 我已经运行了内存检查,没有报告任何错误。我也尝试过jro…
什么时候将 JDBC 与 lucene 索引结合使用是个好主意?
我正在为我们的应用程序实现一个基于 lucene (Compass) 的搜索引擎,我们将部署到 vmware 环境。客户告诉我,vmware 主机上的 I/O 性能非常糟糕,因此…
Solr 搜索:严重:java.lang.ArrayIndexOutOfBoundsException:-1
当我在 solr 中尝试搜索查询时,出现以下错误,我不确定是什么原因导致的,但这已经停止了我们所有的工作。 这个查询有效: http://10.0.0.13:8080/so…
如何在Lucene 3.5.0中提取文档术语向量
我正在使用 Lucene 3.5.0,我想输出每个文档的术语向量。例如,我想知道某个术语在所有文档和每个特定文档中的频率。 我的索引代码是: import java.i…
如何在 lucene 3.4 中索引/查询嵌套文档?
我正在寻找一种方法来理解新实现的嵌套文档功能如何在 lucene 3.4 中工作。考虑到这是一个非常新的功能,网络上似乎还没有任何可用的教程。有人可以演…
将精确匹配排名最高的最佳 lucene 设置是什么
当我希望精确匹配的排名高于“部分”匹配时,应使用哪些分析器进行索引和搜索?是否可以在相似度类中设置自定义评分? 例如,当我的索引由 car parts…
Lucene 查询(带状疱疹?)
我有一个 Lucene 索引,其中包含如下文档: _id | Name | Alternate Names | Population 123 Bosc de Planavilla (some names here in 5000 345 Plana…
可以使用SKOS的搜索引擎吗?
我目前正在开展一个项目,我们希望将 SKOS 插入到搜索引擎中,以提高搜索结果。一个例子是 Semaphore Smartlogic (封闭、不免费、太大而无法与)。 S…
多值字段和标记化字段之间的评分差异
例如,我每个文档有几个标签。我可以 使用 WhiteSpaceTokenizer 将它们索引为按空格分割的单个文本字符串。 (例如“tag1 tag2 tag3”) 使用 Keyword…
Lucene:数字字段上的非范围查询
我们目前使用的是lucene 2.3.2。我们用前导零和索引填充整数,以便我们也可以支持范围查询。我们正在努力升级到 lucene 3.4 并希望使用 NumericRangeQ…
为什么我的 Android 程序不断出现 OutOfMemory 错误
大家好,我的应用程序涉及 Lucene java 库,我不知道到底是什么错误, 这里是错误控制台 ERROR/AndroidRuntime(25909): java.lang.OutOfMemoryError: …