java解析word2003 doc文件中的表格
我现在有这么一个doc文件,里边有两个表格,表格格式不是很规范(有些单元格会有合并的现像),我查了下POI, 和jacob都支持操作doc文件,请问下这种情况用哪个API更合适,或着有更好的其它选择?
谢谢!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
我现在有这么一个doc文件,里边有两个表格,表格格式不是很规范(有些单元格会有合并的现像),我查了下POI, 和jacob都支持操作doc文件,请问下这种情况用哪个API更合适,或着有更好的其它选择?
谢谢!
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(9)
试试用pageoffice插件吧,很容易解决问题的,楼主可以网上查查
http://www.zhuozhengsoft.com/
推荐试用一下卓正软件的pageoffice,可以很容易的解决这个问题
java解析word2003 doc文件中的表格
去看VBA怎么遍历的吧
我现在用JACOB解析,能拿到表格,但因为单元格有合并,当我去遍历列的时候
Dispatch cols = Dispatch.get(table, "Columns").toDispatch(); // 此表的所有列
Dispatch col = Dispatch.call(cols, "Item", new Variant(i)).toDispatch(); // 循环取出每一列
报如下错误:
Exception in thread "main" com.jacob.com.ComFailException: Invoke of: Item
Source: Microsoft Word
Description: 无法访问此集合中单独的列,因为表格有混合的单元格宽度。
想问下当碰到这种列和行都有单元格合并的情况,怎么去遍历呢?
如果表格很少POI最好,如果操作的表格很多很复杂当然还是要ActiveX,但是ActiveX好复杂啊。个人感觉
要是不跨平台的话可以考虑一下 JCOM,
http://www.oschina.net/code/snippet_214658_7711。不过要求就是机器上必须有word,就是用一种类似java反射的方式去调用vba的方法。功能应该相当强大,等于同于word了,像什么转存其他格式就是直接调用word程序本身的另存为方法一句话搞定。
红薯老大您回答得真快,谢谢
JACOB 不是跨平台的,不过它使用 ActiveX 的方式,对 Word 支持肯定是最强的