搜索 pdf 并在找到时提取页面

发布于 2024-12-02 08:57:51 字数 308 浏览 0 评论 0原文

有谁知道如何在多页 pdf 中搜索某些文本(例如发票号码),然后将该页面提取到单独的文件中?我了解如何使用 FPDI 提取特定页面,然后使用FPDF修改并保存。我不明白的部分是如何搜索 pdf 并确定文本所在的页码。这最好用 php 来完成,但如果需要的话我愿意使用其他东西。

有什么建议吗?

谢谢。

Does anyone know how to search through a multiple page pdf for some text (e.g., an invoice number) and then extract that page to a separate file? I see how I can use FPDI to extract a particular page and then use FPDF to modify and save. The part I can't figure out is how to search the pdf and determine the page number that text is on. This would preferably be done with php, but I'd be willing to use something else if necessary.

Are there any suggestions?

Thank you.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

葬﹪忆之殇 2024-12-09 08:57:51

此页面帮助我找到了解决方案:

http://www.freak-search.com /en/thread/2817957/find_page_number_having_a_given_text

基本上,您在 bash 中使用命令行程序“pdftotext”脚本(请参阅链接)返回页码,然后使用 FPDI 提取页面。效果很好。

This page helped me find a solution:

http://www.freak-search.com/en/thread/2817957/find_page_number_containing_a_given_text

Basically, you use the command line program "pdftotext" in a bash script (see the link) to return the page number and then FPDI to extract the page. Works great.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文