Solr 和 Nutch - 如何控制 Facet?
抱歉,如果这个问题可能太笼统了。如果有的话,我会很高兴获得良好的文档链接。谷歌不会帮我找到它们。 我需要了解如何从 Nutch 爬行然后由 Solr 索引…
如何使用 Lucene Solr 索引近 300 万个 xml 文件
我正在尝试使用 lucene solr 索引近 300 万个 xml 文件。当我尝试使用命令行“java -jar post.jar *.xml”时。机器没有任何反应。我怎样才能进行索引…
Solr 多重搜索和按日期范围分组
如果有问题在具有相同短语但不同时间范围的查询中执行多个 Solr 查询。 示例: search for "atom" at: 2011-04-01T10:20:22.0Z TO 2011-04-01T12:20:2…
SOLR - PathHierarchyTokenizerFactory Facet 查询
我一直在尝试对配置为 solr.PathHierarchyTokenizerFactory 的字段执行查询,但查询仅返回所有记录。看来进行方面查询是行不通的。有没有人有办法实现…
比 Apache Solr 更快的搜索平台/索引引擎?
Apache Solr 今天在一次讨论中出现,它似乎具有被认为是最好的独特能力,但我仍然听到一些人抱怨,特别是与 RoR 应用程序等第三方应用程序结合使用时…
Solr DataImportHandler 未对所有记录建立索引
当我运行完全导入时,它仅索引 1 个文档。在日志中,我看到它处理了大部分记录(约 300 条记录)。我在日志中没有看到任何错误。为什么这不会索引查询…
SOLR/LUCENE专家,请帮我设计一个简单的从PDF索引进行关键字搜索的方法?
我涉足 solr 但无法找到一种方法来根据我的需求定制它。 我拥有的: 一堆 PDF 文件。 一组关键字。 我想要实现的目标: 索引 PDF 文件(solrcell - 完…
未找到 Solr DataImportHandler
我正在使用 Solr 3.3.0 和 Tomcat 6.0.26。我能够成功安装 Solr,甚至能够使用 http://localhost:8084/solr/admin 访问其 Web 界面。 现在我想使用它…
大文本字段的比较分组 - 全文搜索、SOLR 还是其他?
我的 mysql 数据库中有大约 150,000 个大文本字段。每个 TEXT 字段代表大约 1 页文本,从这里开始将称为一页。 我想将这些页面分组为非常相关的页面小…
Solr 与 NetBeans
我使用 NetBeans IDE 和 Virtuoso RDBMS 开发了一个 JSP Web 应用程序。 现在我想将 Solr 集成到其中。 我已经从 http://apache.favoritelinks.net//l…
使用 Solr 提取 PDF 元数据时出错
我正在使用 Solr 3.3,我正在尝试从 PDF 文件中提取元数据并为其建立索引。我使用 DataImportHandler 和 TikaEntityProcessor 来添加文档。以下是我的…