SOLR/LUCENE专家,请帮我设计一个简单的从PDF索引进行关键字搜索的方法?
我涉足 solr 但无法找到一种方法来根据我的需求定制它。 我拥有的: 一堆 PDF 文件。 一组关键字。 我想要实现的目标: 索引 PDF 文件(solrcell - 完…
未找到 Solr DataImportHandler
我正在使用 Solr 3.3.0 和 Tomcat 6.0.26。我能够成功安装 Solr,甚至能够使用 http://localhost:8084/solr/admin 访问其 Web 界面。 现在我想使用它…
大文本字段的比较分组 - 全文搜索、SOLR 还是其他?
我的 mysql 数据库中有大约 150,000 个大文本字段。每个 TEXT 字段代表大约 1 页文本,从这里开始将称为一页。 我想将这些页面分组为非常相关的页面小…
Solr 与 NetBeans
我使用 NetBeans IDE 和 Virtuoso RDBMS 开发了一个 JSP Web 应用程序。 现在我想将 Solr 集成到其中。 我已经从 http://apache.favoritelinks.net//l…
使用 Solr 提取 PDF 元数据时出错
我正在使用 Solr 3.3,我正在尝试从 PDF 文件中提取元数据并为其建立索引。我使用 DataImportHandler 和 TikaEntityProcessor 来添加文档。以下是我的…
SOLR:索引失败。回滚所有更改。
有以下内容 '${dataimporter.last_index_time}'" deltaQuery="select id from article where last_update_time > '${dataimporter.last_index_time}'"…
Solr 日期提升和按相关结果排序无法正常工作
我正在实现 Solr dismax 搜索,并使用此函数 recip(ms(NOW,PubDate),3.16e-11,1000,1000) 进行日期提升。一切正常,但只有一个问题。 如果搜索关键字…
从 solr 和 nutch 生成的搜索索引中获取文本片段
我刚刚按照入门教程配置了 nutch 和 solr,以成功对网站上的文本进行爬网和索引。现在我尝试通过修改示例速度模板来制作搜索页面。 现在回答我的问题…
模拟和单元测试 Solr 和 Lucene 索引
我们需要控制生产solr索引中的数据,并且需要它与新的开发兼容。理想情况下,我们希望在本地计算机上模拟索引,使用 solr 进行查询并编写单元测试来查…
避免 Solr 由于词干而缓慢突出显示
我对使用 Solr 还很陌生,但想寻求您的帮助。 我正在开发一个应用程序,它应该能够突出显示查询结果。为此,我使用正则表达式分段器: 500 0.5 ]]> ]]…
如何在Solr中进行多边形空间搜索?
我们将 Solr 3.3 与 Solr.NET 结合使用,并且在文档中放置了动态“location_p”位置类型字段,现在我们需要能够进行空间搜索。 我已经进行了半径搜索…
需要一个可以在大多数共享主机上运行的 Solr 替代方案
当我发现我公司的主机托管 python,但在我们当前的计划下从不托管 JSP 时,我感到非常震惊。 我用 python(不是 Django) 开发了一个使用 Solr 的搜索…
配置solr和sql server时出现空指针异常
当我尝试从 sql server 上的数据库中索引表时,我收到此错误: SEVERE: Exception while processing: APPLICATION document : SolrInputDocument[{}]:…