pdf文件黑线

发布于 2024-10-18 11:43:37 字数 596 浏览 6 评论 0原文

我正在尝试找到一种方法来生成黑线pdf文件(即突出显示文件的两个版本之间的差异,类似于MS Word中的“比较和合并文档”功能)。

到目前为止,我已经尝试了几种不同的方法,但结果并不理想: 1) 使用 Adob​​e Acrobat 的“比较文档”功能。这种方法的主要问题是一些文本被解释为图像(为什么?文本可以复制/粘贴..),导致非常粗粒度的差异。

2) 将.pdf 转换为Word 文档并使用Word 的比较功能。这种方法的问题是从 .pdf -> 的转换。 .doc 不可靠(.doc 文件中缺少某些文本),并且存在一些误报差异(格式化字符和用于创建 Word 文档的 Acrobat 等)。

3)一个名为Workshare的软件(http://www.workshare.com/products/)。这..严重损坏..文档处于无法使用的状态。

我们使用在 Django Web 框架中运行的 ReportLab 库以编程方式生成 .pdf 文件。因此,以编程方式生成黑线 pdf 是可能的,并且可能会产生最佳结果,但这将是一项更耗时的任务。

有什么建议吗?

(真的吗?stackoverflow 不允许我使用名为“blacklined”的标签?真的吗??!)

I am trying to find a way to produce blacklined pdf files (ie. differences between two versions of the file are highlighted, similar to the "Compare and merge documents" feature in MS Word).

I have tried a few different approaches thus far, with sub-optimal results:
1) Using Adobe Acrobat's "Compare Documents" feature. The main problem with this approach was some text was interpreted as an image (why? The text could be copy/pasted..), leading to very coarse-grained diffs.

2) Converting the .pdfs into Word documents and using Word's comparison feature. The issue with this approach is the conversion from .pdf -> .doc is unreliable (some text missing in the .doc file), and some false-positive diffs (formatting characters and such Acrobat used to create the Word document).

3) A piece of software called Workshare (http://www.workshare.com/products/). This.. badly mangled.. the documents to a state of unusability.

We generate the .pdf files programatically using the ReportLab library running in the Django web framework. Hence, producing blacklined pdfs programatically is possible, and will probably produce the best results, but this would be a more time-consuming task.

Any suggestions?

(Really? stackoverflow won't allow me to use a tag called 'blacklining'? Really??!)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文