用Python替换PDF文档中的图像?
我们使用存储在 CMS 中的 RGB 图像生成 PDF 文档。
作为 PDF 处理的一部分,我们有时需要转换 RGB 图像 到 CMYK(用于印刷制作)。
使用 Python 将图像从 RGB 转换为 CMYK 似乎是可行的 使用 LittleCMS 和 PyLittleCMS 绑定(加上 RGB 输入和 CMYK 输出设备的 ICC 颜色配置文件)。
但是,是否有一些基于 Python 的选项可以迭代 PDF 中的图像,提取图像数据并将其替换为处理后的 CMYK 变体?
We generate PDF documents with RGB images stored in a CMS.
As part of the PDF processing we sometimes have the need to convert the RGB images
to CMYK (for print productions).
Converting the images from RGB to CMYK seems to be feasible with Python
using LittleCMS and the PyLittleCMS bindings (plus the ICC color profiles for the RGB input and CMYK output device).
However is there some Python-based option to iterate over the images inside a PDF, extracting the image data and replacing them with the processed CMYK variants?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我认为没有任何免费的 Python 工具可以完全满足您的需求。以下是一些选项:
PoDoFo 没有成熟的 Python 绑定,但可以读写 PDF,有 支持 PDF 图像和色彩空间。
PDFMiner 是一个纯 Python PDF 解析器,但它不这样做很多图像。这是一个开始,但可能需要相当多的工作才能完成您想要的事情。
ReportLab 的商业版本也许能够通过 PageCatcher 实现您想要的功能;我已经好几年没用过它了,但你可能会调查一下。 (免费的 ReportLab 只能写入 PDF,而不能读取它们。)
I don't think there's any free Python tools that do exactly what you want. Here are some options:
PoDoFo doesn't have mature Python bindings but can read and write PDFs, has support for PDF images and color spaces.
PDFMiner is a pure-Python PDF parser but it doesn't do much with images. This is a start, but would probably take quite a bit of work to do what you want.
The commercial version of ReportLab may be able to do what you want with PageCatcher; I haven't used it in a few years but you might investigate it. (The free ReportLab only writes PDFs, it doesn't read them.)