solr-cell

solr-cell

文章 0 浏览 5

如何使用 apache Solr 1.4.1 配置 Apache Tika

我想索引大量 pdf 文档。 我找到了一个参考资料,表明可以使用 Apache Tika 来完成此操作,但不幸的是,我找不到任何描述我可以在 Solr 1.4.1 中配置 …

所有深爱都是秘密 2024-09-26 00:38:26 12 0

索引 pdf 文档

索引 pdf 文档的最佳方法是什么?我应该通过将 pdf 文档转换为 txt 来索引它们,还是有更好的方法来索引 pdf 文件?…

流年已逝 2024-09-24 02:34:07 9 0

SOLR Tika:将文件文本添加到现有记录(ExtractingRequestHandler)

我正在使用“名称”、“标题”和“描述”字段对 SOLR 中的帖子进行索引。我希望以后能够使用 Tika / ExtractingRequestHandler 添加文件(例如 Word …

笑,眼淚并存 2024-09-12 04:51:27 11 0

Solr 的 TikaEntityProcessor 不工作

我正在尝试让 Solr 索引一个数据库,其中一列是我想要索引的 PDF 文档的文件名。我的配置如下所示: 我正在使用 trunk 中的 Solr(截至上周)。导入过…

蘸点软妹酱 2024-09-03 10:17:04 9 0

索尔;这意味着什么?

在位于 solr 下的示例目录中的 README.txt 文件的末尾,我找到了这一行: 注意:此 Solr 示例服务器引用服务器外部的 SolrCell jar solrconfig.xml 中…

风轻花落早 2024-09-03 09:51:53 14 0

如何在 SOLR 中索引文档?

我在 Ubuntu 10.04 上运行 Solr 1.4(通过 apt-get solr-tomcat 安装),它似乎工作正常。不过,我很难找到有关如何索引文档的任何连贯信息。我是 SOL…

冰雪梦之恋 2024-08-31 13:22:35 14 0

Solr ExtractingRequestHandler 为 pdf 文档提供空内容

我在 Solr 中使用 ExtractingRequestHandler 来获取文档内容并为其建立索引。它适用于所有 Microsoft 文档,但对于 PDF,提取的内容为空。我还尝试了…

你如我软肋 2024-08-16 09:19:50 9 0

使用 Zend Lucene 搜索 Office 2003 或更早版本的文件

我知道已经有支持 Office 2007 文件的对象,但是是否有任何本机 Office 2003 或更早版本的支持?…

我最亲爱的 2024-08-10 00:30:42 13 0
更多

推荐作者

qq_2gSKZM

文章 0 评论 0

∞梦里开花

文章 0 评论 0

qq_IklFPL

文章 0 评论 0

迷途知返

文章 0 评论 0

深海不蓝

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文