以编程方式替换 PDF 中的文本

发布于 2024-11-18 18:18:01 字数 172 浏览 1 评论 0原文

我有一些 PDF 文件,其中的文本需要替换。更具体地说,应该翻译文本并用翻译版本替换。 PDF 结构的其余部分保持完整非常重要。请注意,文本在 PDF 中可用,不需要 OCr 等技术。另外,如果保留字体和其他文本属性,那就太好了。

您会推荐哪些库来将文本提取为易于编辑的格式(例如 CSV)并再次将新文本放回原处?

I have PDF files with text that should be replaced. More specificly, the text should be translated and replaced with the translated version.
It's important that the rest of the PDF structure stays intact. Note that the text is available in the PDFs and techniques like OCr are not needed. Also, it would be nice if font and other text attributes are kept.

Which libraries would you recommend for extracting the text to an easy to edit format (such as CSV) and put the new text back in again?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

怪我鬧 2024-11-25 18:18:01

假设您要用不同的语言替换文本,则在大多数情况下您必须选择不同的字体,并且字体的选择并不简单。我已经使用 Foxit 库成功地更改文本或创建 PDF。

Assuming you are replacing text with a different language, you will have to choose a different font in most cases, and the font choice is non-trivial. I've used the Foxit libraries to change text or create PDFs with success.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文