iText 搜索、突出显示、结果图像

发布于 2024-10-07 15:26:25 字数 101 浏览 5 评论 0原文

我想做这些任务: 1-在pdf中查找一个单词 2-突出显示该 pdf 中出现的所有内容, 3-将突出显示的 pdf 保存为其页面的图像。

我该怎么做? 任何帮助将不胜感激。

I want to Do these tasks:
1-find a word in pdf
2-highlight all occurrences in that pdf,
3-save highlighted pdf as images of its pages.

How can I do this ?
Any help will be appreciated.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

无声无音无过去 2024-10-14 15:26:25

com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy

它将为您提供页面上每段文本的基线、上升和下降。您可以根据这些信息构建单词和矩形。

不容易,但有可能。

之后,您只需要调用 GhostScript 或 PDFBox 或可以渲染 PDF 的东西即可。很难说是“简单的部分”,但它是一个多次解决的问题。

com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy

It'll give you the baseline, ascent, and descent of every piece of text on the page. It's up to you to build words and rectangles from that information.

Not Easy, but possible.

After that, you just need to call GhostScript or PDFBox or something that can render PDFs. Hardly "the easy part", but it's a solved problem many times over.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文