卢森3.0.3 | *.docx 文件搜索问题
我正在 StandardAnalyzer 的帮助下为 *.docx 文件创建索引,这很好。但在搜索时,它没有给出这些 *.docx 文件的结果。
任何帮助或建议将不胜感激!
I am creating index with help of StandardAnalyzer for *.docx file it's fine. But at the time of searching it do not gives result for these *.docx file.
any help or suggestion will be appreciated!!!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如何将 *.docx 文件转换为可索引(文本)格式?
我们使用 Apache POI 来对 *.docx(和其他办公格式)进行索引,这工作得很好!
您可以在此处查看实现:http://code.google.com/p/gtxcontentconnector/source/browse/#svn%2Ftrunk%2Fcontentconnector-poi-transformer%2Fsrc%2Fmain %2Fjava%2Fcom%2Fgentics%2Fcr%2Flucene%2Findexer%2Ftransformer
How do you convert the *.docx file to an indexable (text) format?
We use Apache POI to get our *.docx (and other office formats) indexed and this works pretty fine!
You can have a look at the Implementation here: http://code.google.com/p/gtxcontentconnector/source/browse/#svn%2Ftrunk%2Fcontentconnector-poi-transformer%2Fsrc%2Fmain%2Fjava%2Fcom%2Fgentics%2Fcr%2Flucene%2Findexer%2Ftransformer