关于POI读取Word中的文字和图片
Hi,
如何在读取docx后缀的word文档时读取图片文件?同时如何获取图片的大小和位置?
public static void main(String[] args) { String path = TestMain.class.getClassLoader().getResource("template.docx").getPath(); File file = new File(path); try { FileInputStream fis = new FileInputStream(file); XWPFDocument document = new XWPFDocument(fis); XWPFWordExtractor xwpfWordExtractor = new XWPFWordExtractor(document); String text = xwpfWordExtractor.getText(); System.out.println(text); List<XWPFPictureData> picList = document.getAllPictures(); for (XWPFPictureData pic : picList) { System.out.println(pic.getPictureType() + file.separator + pic.suggestFileExtension() +file.separator+pic.getFileName()); byte[] bytev = pic.getData(); FileOutputStream fos = new FileOutputStream("d:\"+pic.getFileName()); fos.write(bytev); } fis.close(); } catch (IOException e) { e.printStackTrace(); }
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
POI读取word中的文字和图片 倒是实现了
但是图片样式不知道怎么保存?
用POI读取word中的文字和图片还是太困难了,最好的办法还是用office提供的接口,PageOffice可以调用office接口,也对office的接口做了一套封装的接口,可以用来读取word中文字和图片的内容,把图片提取出来,楼主百度一下吧,我记得PageOffice开发包中就有这样的例子
POI没有用过,我之前操作Excel用POI,Word的话,我是用iText。