请建议转换 PDF DOC RTF HTML 时的中间文件格式

发布于 2024-10-08 23:43:14 字数 207 浏览 0 评论 0原文

我要写一些转换器。

我认为 HTML 是最好的选择。例如:
- 首先,我创建 HTML->PDF
- 第二步,我创建 DOC -> HTML(还可以获取 DOC->PDF)
...所以我将有 3 个转换器而不是 2 个。

您可以建议什么中间格式? (XML 是否更适合我的任务,但如何保留格式样式)

提前致谢。

I'm going to write some converters.

I fought HTML is the best for that. For example:
- at first, i create HTML->PDF
- at second, i create DOC -> HTML (and get DOC->PDF also)
...so i will have 3 converters instead of 2.

What intermediate format can you suggest? (is the XML better for my task, but how to preserve formatting styles)

Thanks in advance.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

夜声 2024-10-15 23:43:14

HTML 作为一种中间语言有它的局限性 - 您需要用 CSS 来补充它以捕获表现方面的内容。不过,将内容和呈现分开是有用的。

您是否考虑过使用纯文本格式,例如multimarkdowntextile< /a>?

否则我会怀疑类似 LaTeXRTF 将允许您捕获更多的演示布局。

已经存在许多可以执行您所描述的操作的应用程序。例如 Pandoc

HTML as an intermediate language has it's limitations - you need to supplement it with CSS to capture presentational aspects. Separation of content and presentation is useful though.

Have you considered using a plain text format such as multimarkdown or textile?

Otherwise I would suspect that something like LaTeX or RTF would allow you to capture more of the presentation layout.

There already exist many applications that do what you describe. For example Pandoc

世界和平 2024-10-15 23:43:14

我认为 XML 是任何转换的最佳中间格式。此外,您还可以使用自己的文本或二进制格式。

I think XML is the best intermediate format for any conversion. Also, you may use your own text or binary format.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文