在 pura java 中将 docx/pptx 转换为 MHTML
我正在努力将 Word 文档和 Power Point 演示文稿转换为 HTML/MHTML 页面。 我可以使用 docx4j 将文档转换为 html,但它会扭曲并创建图像等作为单独的文件(标准 HTML)。
我有一个要求,用户上传 docx 和 pptx 文件,然后我可以在网络浏览器中向他们显示输出 HTML。所以我需要从文档输出一个 *.mht 文件。 MS Word 将文件另存为 mht 生成的输出非常棒。我想要类似的功能,但仅限于纯java。
我将在Linux上部署该服务,因此甚至无法调用Ms Office的本机命令。
任何帮助将不胜感激。
谢谢
I am struggling to convert word documents and power point presentations to convert to HTML/MHTML pages.
I am able to convert docs to html using docx4j but it comes out as distorted and creates images etc as separate files (standard HTML).
I have a requirement where users upload docx and pptx files and then I can show them the output HTML in web browser. So I need a single *.mht file output from document.
The kind of output generated by MS word aby saving file as mht is great. I want similar function but in pure java only.
I will deploy the service on Linux so can't even call native commands of Ms Office.
Any help will be appreciated.
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
请参阅如何读取或解析 MHTML (.mht) 文件以java为起点。
See How to read or parse MHTML (.mht) files in java as a starting point.