如何在Python中的PDF文档中包含PDF页面

发布于 07-15 10:04 字数 207 浏览 10 评论 0原文

我正在使用 Python 中的 reportlab 工具包生成一些 PDF 格式的报告。 我想使用已经以 PDF 格式发布的文档的一些预定义部分包含在生成的 PDF 文件中。 是否有可能(以及如何)在reportlab或python库中完成这个任务?

我知道我可以使用其他一些工具,例如 PDF Toolkit (pdftk),但我正在寻找基于 Python 的解决方案。

I am using reportlab toolkit in Python to generate some reports in PDF format. I want to use some predefined parts of documents already published in PDF format to be included in generated PDF file. Is it possible (and how) to accomplish this in reportlab or in python library?

I know I can use some other tools like PDF Toolkit (pdftk) but I am looking for Python-based solution.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

水晶透心2024-07-22 10:04:11

我目前正在使用 PyPDF 来读取、写入和组合现有的 PDF 和 ReportLab 以生成新内容。 使用两个包似乎比我能找到的任何单个包都更好。

I'm currently using PyPDF to read, write, and combine existing PDF's and ReportLab to generate new content. Using the two package seemed to work better than any single package I was able to find.

空心↖2024-07-22 10:04:11

如果您想将现有的 PDF 页面放入 Reportlab 文档中,我建议您使用 pdfrw。 与 PageCatcher 不同的是,它是免费的。

我已经将它用于多个项目,在这些项目中我需要将条形码等添加到现有文档中,并且效果非常好。 项目页面上有几个示例,介绍了如何将其与 Reportlab 一起使用。

但需要注意以下几点:

如果源 PDF 包含错误(例如,由于原始程序不完全遵循 PDF 规范),即使 Adob​​e Reader 之类的软件在读取 PDF 时没有明显问题,pdfrw 也可能会失败。 pdfrw 目前的容错能力不是很好。

此外,pdfrw 的工作原理是完全不知道您所放置的 PDF 页面的实际内容。 例如,您将无法使用 pdfrw 检查页面以查看其右下角是否包含特定文本字符串。 但是,如果您不需要需要做类似的事情,那么应该没问题。

If you want to place existing PDF pages in your Reportlab documents I recommend pdfrw. Unlike PageCatcher it is free.

I've used it for several projects where I need to add barcodes etc to existing documents and it works very well. There are a couple of examples on the project page of how to use it with Reportlab.

A couple of things to note though:

If the source PDF contains errors (due to the originating program following the PDF spec imperfectly for example), pdfrw may fail even though something like Adobe Reader has no apparent problems reading the PDF. pdfrw is currently not very fault tolerant.

Also, pdfrw works by being completely agnostic to the actual content of the PDF page you are placing. So for example, you wouldn't be able to use pdfrw inspect a page to see if it contains a certain string of text in the lower right-hand corner. However if you don't need to do anything like that you should be fine.

仅一夜美梦2024-07-22 10:04:11

ReportLab 有一个附加组件 - PageCatcher

There is an add-on for ReportLab — PageCatcher.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文