如何使用 apache Solr 1.4.1 配置 Apache Tika
我想索引大量 pdf 文档。
我找到了一个参考资料,表明可以使用 Apache Tika 来完成此操作,但不幸的是,我找不到任何描述我可以在 Solr 1.4.1 中配置 Apache Tika 的参考资料。
配置完成后,我确实配置了它,如何在不使用curl的情况下直接将文档发送到Solr?
我正在使用 solrnet 进行索引。
I want to index a large number of pdf documents.
I have found a reference showing that it could be done using Apache Tika but unfortunately I cannot find any reference that describes I could configure Apache Tika in Solr 1.4.1.
Once configured I do have it configured, how can I send documents to Solr directly without using curl?
I am using solrnet for indexing.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
请参阅 ExtractingRequestHandler
See ExtractingRequestHandler
对SolrNet 中的ExtractingRequestHandler的支持尚未完成。您可以完成它的实现,也可以解决它并制作您自己的 HttpWebRequest。
Support for ExtractingRequestHandler in SolrNet is not yet complete. You can either finish implementing it, or work around it and craft your own HttpWebRequests.