用java读取微软word文档
有没有一种简单的方法可以在不使用 Apache POI 包的情况下用 java 读取 Microsoft Word 文档?
或者在不使用 Apache POI 包的情况下实现相同目标的其他替代方法是什么?
is there a simple way of reading a microsoft word document in java without using Apache POI package?
Or what are other alternative to achieving the same without using Apache POI package?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
使用 Java 破解 Office 2007 可能会有所帮助。
Using Java to Crack Office 2007 might help.
有一个商业替代方案,非常易于使用但商业 - Aspose
There is a commercial alternative which is pretty easy-to-use but commercial - Aspose
java 文档 ? http://www.javadocx.com/ 它不适合阅读,而是用于生成动态输出。
java docx ? http://www.javadocx.com/ it's not much for reading, but for generating dynamic output.
有点像。如果是 WordML 文件,您可以将其解压缩,然后手动从里面的 XML 文件中提取数据,但相信我,这不是一个令人愉快的过程。当我们在我的公司尝试这样做时,我们希望能够利用一些 OOo 库来清理文档,但是效果不太好。
Sort of. If it is a WordML file, you can unzip it and then manually extract the data from the XML files inside, but trust me, it is not a pleasant process. When we tried to do it at my company we had hoped to be able to leverage some of the OOo libraries to clean up the documents and, well, it didn't work too well.