用于 PDF 到文本转换的开源 Java 库
我听说过 PDFBox,但是还有另一个将 PDF 格式转换为文本文件的好工具吗(或词)?能给我项目符号、编号、标题、副标题等的东西吗?
如果您知道一些不是免费的但确实很好的东西 - 它仍然是相关的!
谢谢!
I've heard about the PDFBox, but is there another good tool for converting a PDF format into a text file (or word)? something that will give me bullet, numbering, title ,sub-titles, etc.?
If you know about something that is not for free, but is really good - it is still relevant!
thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我使用了 Itext 并且工作正常。
I used Itext and it work fine.
我认为 IcePdf 也是值得考虑的选择之一。
IcePdf is also one option to be considered as I believe.
我找到了我想要的!
PdfClown 太棒了!你应该尝试一下。它让我可以获取文本、书签,并将文本附加到书签(尽管这并不简单)。没有其他库让我这样做,最接近的一个是 Adobe 的 acrobat,但它很旧,没有支持。
所以我的选择是PdfClown。
I found what I wanted!
PdfClown is great! you should try it out. It let me get the text, the bookmarks, and attaching the text to its bookmark (even though it is not trivial though). No other library let me do this, the closest one was Adobe's acrobat, but it is very old and has no support.
so my choice is PdfClown.