在Python中隐藏PDF文件中的信息

发布于 2024-09-30 01:02:47 字数 202 浏览 2 评论 0原文

在 Python 中,我有 ReportLab 生成的文件。现在,我需要从该 PDF 中提取一些页面并隐藏机密信息。

我可以创建一个带有黑点的 PDF 文件并使用 pyPdf 来 mergePage,但人们仍然可以选择并复制粘贴黑点下的信息。

有没有办法让这些地点完全保密?

例如,我需要隐藏页面上的地址,我该怎么做?

谢谢,

In Python, I have files generated by ReportLab. Now, i need to extract some pages from that PDF and hide confidential information.

I can create a PDF file with blacked-out spots and use pyPdf to mergePage, but people can still select and copy-paste the information under the blacked-out spots.

Is there a way to make those spots completely confidential?

Per example, I need to hide addresses on the pages, how would i do it?

Thanks,

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

终陌 2024-10-07 01:02:47

基本上,您必须删除 PDF 页面内容流中相应的文本绘制命令。生成两次页面要容易得多,一次包含机密信息,一次不包含机密信息。

有可能(我不太了解 ReportLab)以更容易访问机密信息(例如作为单独的 XObject)进行删除的方式专门制作 PDF。尽管如此,您仍然必须对 PDF 进行相当低级的操作——我建议不要这样做。

Basically you'll have to remove the corresponding text drawing commands in the PDF's page content stream. It's much easier to generate the pages twice, once with the confidential information, once without them.

It might be possible (I don't know ReportLab enough) to specially craft the PDF in a way that the confidential information is easier accessible (e.g. as separate XObjects) for deletion. Still you'd have to do pretty low-level operations on the PDF -- which I would advise against.

梦里南柯 2024-10-07 01:02:47

(抱歉,我发布问题时无法登录...)

不幸的是,该文档无法随意重新生成(上下文相关),而那些 PDF 文件(大约 35 个)有 3000+ 页。

我正在考虑使用 pdf2ps 和 pdf2ps 回来,但有很多质量。

pdf2ps -dLanguageLevel=3 输入.pdf - | ps2pdf14 - output.pdf

如果我使用“pdftops”,则文本仍然可选。如果有办法让它像“pdf2ps”一样不可选择,但质量更好,它也可以。

(Sorry, I was not able to log on when I posted the question...)

Unfortunately, the document cannot be regenerated at will (context sensitive), and those PDF files (about 35) are 3000+ pages.

I was thinking about using pdf2ps and pdf2ps back, but there is a lot of quality.

pdf2ps -dLanguageLevel=3 input.pdf - | ps2pdf14 - output.pdf

And if i use "pdftops" instead, the text is still selectable. If there is a way to make it non-selectable like with "pdf2ps" but with better quality, it will do too.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文