如何在 Java Apache POI 库中使用嵌入式方程?
我正在尝试使用“Apache POI”将 .doc MS Word 文件中的嵌入方程和文本提取到 .ppt MS Powerpoint 文件中,我已成功提取文本,但如何提取嵌入方程?
如果我只将其提取为文本,则嵌入方程会像这样出现:
!!EMBED Equation.3
I am trying to use "Apache POI" to extract embedded equation and text from a .doc MS Word file into a .ppt MS Powerpoint file, I have successfully extracted text, but how do I extract embedded equations?
the Embedded Equations comes out like this if I only extract it as text:
!!EMBED Equation.3
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这可能对二进制 .doc 格式没有帮助,但对于较新的 .docx 格式,我能够使用以下代码获取作为 OLE 文档嵌入的方程式:
然后您可以 提取其中的 MathType 数据并将其交给MTEF 解析器。
如果您不需要 MathType 数据,还有一个仅呈现方程的占位符图像(WMF 格式)。
This may not help you with the binary .doc format, but for the newer .docx format, I was able to get to the equation, which is embedded as an OLE document, using the following code:
And then you can extract the MathType data in there and hand it to a MTEF parser.
If you don't need the MathType data, there is also a placeholder image (in WMF format) that just renders the equation.