使用 PDFBox 从 PDF 文档中读取特定页面
如何使用 PDFBox 从 PDF 文档中读取特定页面(给定页码)?
How do I read a particular page (given a page number) from a PDF document using PDFBox?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(6)
这应该有效:
如教程的书签部分所示
Update 2015, Version 2.0.0 SNAPSHOT似乎
这已被删除并放回(?)。 getPage 位于 2.0.0 javadoc。要使用它:
getAllPages方法已重命名getPages
This should work:
as seen in the BookMark section of the tutorial
Update 2015, Version 2.0.0 SNAPSHOT
Seems this was removed and put back (?). getPage is in the 2.0.0 javadoc. To use it:
The getAllPages method has been renamed getPages
我想我会在这里添加我的答案,因为我发现上述答案很有用,但不完全是我需要的。
在我的场景中,我想单独扫描每个页面,查找关键字,如果出现该关键字,则对该页面执行某些操作(即复制或忽略它)。
我尝试在我的答案中简单地替换常见变量等:
Thought I would add my answer here as I found the above answers useful but not exactly what I needed.
In my scenario I wanted to scan each page individually, look for a keyword, if that keyword appeared, then do something with that page (ie copy or ignore it).
I've tried to simply and replace common variables etc in my answer:
这是解决方案。希望它能解决您的问题。
Here is the solution. Hope it will solve your issue.
你可以通过 PDDocument 实例使用 getPage 方法
you can you getPage method over PDDocument instance
将其添加到命令行调用中:
将 1 更改为您需要的页码。
Add this to the command-line call:
Change 1 to the page number that you need.