如何在Python中的PDF文档中包含PDF页面
我正在使用 Python 中的 reportlab 工具包生成一些 PDF 格式的报告。 我想使用已经以 PDF 格式发布的文档的一些预定义部分包含在生成的 PDF 文件中。 是否有可能(以及如何)在reportlab或python库中完成这个任务?
我知道我可以使用其他一些工具,例如 PDF Toolkit (pdftk),但我正在寻找基于 Python 的解决方案。
I am using reportlab toolkit in Python to generate some reports in PDF format. I want to use some predefined parts of documents already published in PDF format to be included in generated PDF file. Is it possible (and how) to accomplish this in reportlab or in python library?
I know I can use some other tools like PDF Toolkit (pdftk) but I am looking for Python-based solution.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
发布评论
评论(3)
如果您想将现有的 PDF 页面放入 Reportlab 文档中,我建议您使用 pdfrw。 与 PageCatcher 不同的是,它是免费的。
我已经将它用于多个项目,在这些项目中我需要将条形码等添加到现有文档中,并且效果非常好。 项目页面上有几个示例,介绍了如何将其与 Reportlab 一起使用。
但需要注意以下几点:
如果源 PDF 包含错误(例如,由于原始程序不完全遵循 PDF 规范),即使 Adobe Reader 之类的软件在读取 PDF 时没有明显问题,pdfrw 也可能会失败。 pdfrw 目前的容错能力不是很好。
此外,pdfrw 的工作原理是完全不知道您所放置的 PDF 页面的实际内容。 例如,您将无法使用 pdfrw 检查页面以查看其右下角是否包含特定文本字符串。 但是,如果您不需要需要做类似的事情,那么应该没问题。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
我目前正在使用 PyPDF 来读取、写入和组合现有的 PDF 和 ReportLab 以生成新内容。 使用两个包似乎比我能找到的任何单个包都更好。
I'm currently using PyPDF to read, write, and combine existing PDF's and ReportLab to generate new content. Using the two package seemed to work better than any single package I was able to find.