iText 搜索、突出显示、结果图像
我想做这些任务: 1-在pdf中查找一个单词 2-突出显示该 pdf 中出现的所有内容, 3-将突出显示的 pdf 保存为其页面的图像。
我该怎么做? 任何帮助将不胜感激。
I want to Do these tasks:
1-find a word in pdf
2-highlight all occurrences in that pdf,
3-save highlighted pdf as images of its pages.
How can I do this ?
Any help will be appreciated.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy
它将为您提供页面上每段文本的基线、上升和下降。您可以根据这些信息构建单词和矩形。
不容易,但有可能。
之后,您只需要调用 GhostScript 或 PDFBox 或可以渲染 PDF 的东西即可。很难说是“简单的部分”,但它是一个多次解决的问题。
com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy
It'll give you the baseline, ascent, and descent of every piece of text on the page. It's up to you to build words and rectangles from that information.
Not Easy, but possible.
After that, you just need to call GhostScript or PDFBox or something that can render PDFs. Hardly "the easy part", but it's a solved problem many times over.