将喜欢PDF的epub保留

发布于 2025-02-07 14:24:53 字数 263 浏览 2 评论 0原文

我目前正在研究一个项目，该项目是使用Python将PDF转换为EPUB。在将PDF转换为ePub的样式时，字体尺寸在EPUB中必须与PDF完全相同。有没有办法使用Python实现这一目标？而且我不需要任何外部软件就可以做到这一点。我使用了aspose。

#code我将

导入aspose.words用作aw

doc = aw.document（“ input.pdf”） doc.save（“ output.epub”）

，它是一个简单的文本pdf。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

友欢 2025-02-14 14:24:53

您将获得各种答案/评论，这些答案/评论会要求您显示您尝试过的内容并发布示例文档等。

让我为您节省麻烦。您的问题似乎很简单，因为想要将PDF转换为EPUB并保留样式信息。

祝你好运。

这一切都取决于您的PDF文件。它是否具有嵌入式字体或依赖系统字体？复杂的布局？标题和页脚？那图像呢？ Dingbats字符？如果PDF中没有文本，而只是文本字符的后记绘图怎么办？如果PDF仅由PDF容器中的多次页面组成，该怎么办？一切都用英语吗？是否有Unicode字符？您是否想在页面级别获得样式？段落？句子？单词？还是角色级别？

基本上，这是一个棘手的问题。 PDF被设计为最终使用格式而不是可互换格式。大多数事情都会转换为PDF，因为有人想控制最终产品的外观。您可以查看PDF的文本提取工具，但是使用OpenSOURCE或商业工具没有简单的解决方案。

回复收藏 0 原文

信愁 2025-02-14 14:24:53

您可以使用aspose.words for Python轻松将PDF转换为epub。代码很简单：

import aspose.words as aw

doc = aw.Document("C:\\Temp\\in.pdf")
doc.save("C:\\Temp\\out.epub")

但是，将PDF加载到Aspose.Words文档对象模型后，它将从固定页面布局转换为流文档。当将文档保存到epub时，将其保存为流文档。恐怕，这可能会导致布局和格式化转换时的格式化。

You can easily convert PDF to EPUB using Aspose.Words for Python. The code is pretty simple:

import aspose.words as aw

doc = aw.Document("C:\\Temp\\in.pdf")
doc.save("C:\\Temp\\out.epub")

However, upon loading PDF into Aspose.Words Document Object Model it is converted from fixed page layout to flow document. And when document is saved to EPUB it is saved as flow document. I am afraid, this might lead into layout and formatting loses upon conversion.

回复收藏 0 原文

~没有更多了~