apache-tika

apache-tika

文章 0 浏览 6

SOLR Tika:将文件文本添加到现有记录(ExtractingRequestHandler)

我正在使用“名称”、“标题”和“描述”字段对 SOLR 中的帖子进行索引。我希望以后能够使用 Tika / ExtractingRequestHandler 添加文件(例如 Word …

笑,眼淚并存 2024-09-12 04:51:27 13 0

Solr 的 TikaEntityProcessor 不工作

我正在尝试让 Solr 索引一个数据库,其中一列是我想要索引的 PDF 文档的文件名。我的配置如下所示: 我正在使用 trunk 中的 Solr(截至上周)。导入过…

蘸点软妹酱 2024-09-03 10:17:04 13 0

索尔;这意味着什么?

在位于 solr 下的示例目录中的 README.txt 文件的末尾,我找到了这一行: 注意:此 Solr 示例服务器引用服务器外部的 SolrCell jar solrconfig.xml 中…

风轻花落早 2024-09-03 09:51:53 19 0

如何在 SOLR 中索引文档?

我在 Ubuntu 10.04 上运行 Solr 1.4(通过 apt-get solr-tomcat 安装),它似乎工作正常。不过,我很难找到有关如何索引文档的任何连贯信息。我是 SOL…

冰雪梦之恋 2024-08-31 13:22:35 18 0

Solr ExtractingRequestHandler 为 pdf 文档提供空内容

我在 Solr 中使用 ExtractingRequestHandler 来获取文档内容并为其建立索引。它适用于所有 Microsoft 文档,但对于 PDF,提取的内容为空。我还尝试了…

你如我软肋 2024-08-16 09:19:50 12 0
更多

推荐作者

牛↙奶布丁

文章 0 评论 0

COSO

文章 0 评论 0

落叶

文章 0 评论 0

暗地喜欢

文章 0 评论 0

qq_i8qOEG

文章 0 评论 0

qq_Wl4Sbi

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文