Java中将Word文档转为HTML的方法?
需求:
输入Word文档(主要是doc,如果支持docx更好),输出HTML格式的字符串。并且能保证字体、颜色、文字和段落格式、图片、表格等不变。
在网上搜到的资料中,大部分人推荐POI。POI我也试过了,但是感觉功能比较弱,很多格式在转换过程中丢掉了。一般只能用它来获取文档中所有的文字。当然可能是我使用方法不对?
不知道大家是否有这方面的经验,自己写的、开源的、收费的都可以。希望大家给推荐一个。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Spire.Doc for Java能够满足你提到的需求,在Word转换Html后保证文本格式不会发生变化。有免费版和商业版,免费版对加载文档页数会有限制,商业版不会有任何功能限制。建议使用商业版。下方转换代码供参考: