使用 Zend Lucene 搜索 Office 2003 或更早版本的文件
我知道已经有支持 Office 2007 文件的对象,但是是否有任何本机 Office 2003 或更早版本的支持?
I know there are already objects supporting Office 2007 files, but is there any native Office 2003 or earlier support ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
似乎没有与
Zend_Search_Lucene
,对于这些。尽管如此,考虑到它可以索引 HTML 文档,如果您能找到一种将 Office 2003 文档转换为 HTML 的方法(至少,为了索引 - 与 HTML 文档一起保留原始版本,以供咨询),你也许可以索引那些......
There doesn't seem to be anything bundled with
Zend_Search_Lucene
, for those.Still, considering it can index HTML documents, if you can find a way to convert your Office 2003 documents to HTML (at least, for indexing -- keeping to original version alonside the HTML one, for consultation), you might be able to index those...
我建议使用 Solr 和 Tika 一起使用 JSON 从 PHP 搜索 Solr/Lucene 索引。有关详细信息,请参阅 ExtractingRequestHandler(Solr wiki 页面)文章。
I would recommend indexing the documents with Solr and Tika together and using JSON to search your Solr/Lucene index from PHP. See the ExtractingRequestHandler (Solr wiki page) article for more information.