以编程方式替换 PDF 中的文本
我有一些 PDF 文件,其中的文本需要替换。更具体地说,应该翻译文本并用翻译版本替换。 PDF 结构的其余部分保持完整非常重要。请注意,文本在 PDF 中可用,不需要 OCr 等技术。另外,如果保留字体和其他文本属性,那就太好了。
您会推荐哪些库来将文本提取为易于编辑的格式(例如 CSV)并再次将新文本放回原处?
I have PDF files with text that should be replaced. More specificly, the text should be translated and replaced with the translated version.
It's important that the rest of the PDF structure stays intact. Note that the text is available in the PDFs and techniques like OCr are not needed. Also, it would be nice if font and other text attributes are kept.
Which libraries would you recommend for extracting the text to an easy to edit format (such as CSV) and put the new text back in again?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
假设您要用不同的语言替换文本,则在大多数情况下您必须选择不同的字体,并且字体的选择并不简单。我已经使用 Foxit 库成功地更改文本或创建 PDF。
Assuming you are replacing text with a different language, you will have to choose a different font in most cases, and the font choice is non-trivial. I've used the Foxit libraries to change text or create PDFs with success.