当前位置：文江博客话题详情

ms-word apache-poi

如何使用Apache POI提取word文档的格式信息？

发布于 2024-10-27 08:56:41 字数 178 浏览 2 评论 0 原文

我正在使用 Apache POI 从 MS Word 文件中提取格式信息。

我想提取信息，例如段落是否有项目符号、背景颜色、前景色、对齐方式等。

对此没有太多文档或教程。 Javadoc 也不包含太多有用的信息。

我在哪里可以获得可以帮助我学习 Apache POI API 的教程/好的文档？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一身骄傲 2024-11-03 08:56:41

对于 HWPF (.doc)，您可能需要的类是：

根据您想要的具体属性，它可能位于段落或字符属性上。

我能想到的使用 HWPF 读取 Word 文档并获取文本、检查样式和格式等的最佳示例是 Apache Tika 的 WordExtractor：
https://svn.apache.org/repos/asf/tika/trunk/tika-parsers/src/main/java/org/apache/tika/parser/microsoft/WordExtractor.java

(XWPF对于 .docx 是类似的）

回复收藏 0 原文

~没有更多了~

关于作者

苏璃陌

暂无简介

0 文章

0 评论

24 人气

关注发私信

娇女薄笑

文章 0 评论 0

关注

biaggi

文章 0 评论 0

关注

xiaolangfanhua

文章 0 评论 0

关注

rivulet

文章 0 评论 0

关注

我三岁

文章 0 评论 0

关注

薆情海

文章 0 评论 0

友情链接

文江博客

如何使用Apache POI提取word文档的格式信息？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者