当前位置：文江博客话题详情

是否可以从 PDF 生成 XSL-FO 模板？

发布于 2024-08-22 17:23:09 字数 187 浏览 9 评论 0原文

给定一个 PDF 文档，是否可以生成 XSL-FO (FOP) 模板？

显然，这将是一次性的事情 - 生成的模板只是创建提取适当数据的适当模板的起点。

对我来说，执行此操作的理想工具是基于 Java 的工具，并且应该可以从命令行或通过 ANT 任务执行。如果做不到这一点，它将是在 Linux 和 MacOS X 上运行的东西。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

爱的那么颓废 2024-08-29 17:23:09

据我所知没有这样的工具。没有文档结构信息的 PDF（带标签的 PDF）很像扫描页面。没有语义。您甚至无法确定自己是否能猜出段落开始或结束的正确位置。如果您有带标签的 PDF，您可能可以进一步了解文档结构的详细程度。但我很确定这样你永远不会得到令人满意的结果。在我看来，您可以更快地学习 XSLT 并手动重新创建文档模板（即样式表）。这将为您带来良好的代码可读性、更好的语义以及更好的机会来分解相似文档类型之间的公共元素。

回复收藏 0 原文

~没有更多了~