请建议转换 PDF DOC RTF HTML 时的中间文件格式
我要写一些转换器。
我认为 HTML 是最好的选择。例如:
- 首先,我创建 HTML->PDF
- 第二步,我创建 DOC -> HTML(还可以获取 DOC->PDF)
...所以我将有 3 个转换器而不是 2 个。
您可以建议什么中间格式? (XML 是否更适合我的任务,但如何保留格式样式)
提前致谢。
I'm going to write some converters.
I fought HTML is the best for that. For example:
- at first, i create HTML->PDF
- at second, i create DOC -> HTML (and get DOC->PDF also)
...so i will have 3 converters instead of 2.
What intermediate format can you suggest? (is the XML better for my task, but how to preserve formatting styles)
Thanks in advance.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
HTML 作为一种中间语言有它的局限性 - 您需要用 CSS 来补充它以捕获表现方面的内容。不过,将内容和呈现分开是有用的。
您是否考虑过使用纯文本格式,例如multimarkdown 或 textile< /a>?
否则我会怀疑类似 LaTeX 或 RTF 将允许您捕获更多的演示布局。
已经存在许多可以执行您所描述的操作的应用程序。例如 Pandoc
HTML as an intermediate language has it's limitations - you need to supplement it with CSS to capture presentational aspects. Separation of content and presentation is useful though.
Have you considered using a plain text format such as multimarkdown or textile?
Otherwise I would suspect that something like LaTeX or RTF would allow you to capture more of the presentation layout.
There already exist many applications that do what you describe. For example Pandoc
我认为 XML 是任何转换的最佳中间格式。此外,您还可以使用自己的文本或二进制格式。
I think XML is the best intermediate format for any conversion. Also, you may use your own text or binary format.