Html 转 Doc(Word) 或 RTF 格式
将 html 页面(带有 css、表格、图像等)转换为 word 或 rtf 格式的最佳方法是什么? 我已经知道如何添加
content-type = application/word
标题,但这不是一个选项,因为我们需要将图像嵌入到文档中,以便在没有有效互联网连接的情况下也可以查看它。
我需要免费(最好)或商业 .NET 库或命令行实用程序,因为我需要在共享服务器上托管的 ASP.NET 应用程序上执行此操作:|。
What would the best possible way to convert a html page (with css, tables, images etc.) to be converted to word or rtf format. I already know about adding the
content-type = application/word
header and that's not an option because we need the images embedded in the document so that it can be viewed without an active internet connection.
I need either a free (preferably) or commercial .NET library or a command line utility as I need to do this on a hosted ASP.NET application on a shared server :|.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
如果您使用的是 Word 2003 或 2007,则可以使用 xslt 将 xhtml 文档转换为 Word Xml 文档。 如果您通过 Google 搜索 html 到 docx xsl 你会发现很多相反的例子(将 docx 转换为 html),所以您可以将这些示例之一作为转换的基础。 唯一的挑战是下载图像并将其嵌入到文档中,但是这也是可能的。
If you are using Word 2003 or 2007 you can convert xhtml documents to Word Xml documents using xslt. If you google for html to docx xsl you will find many examples of the opposite (converting docx to html) so you might one of those examples as a basis for a conversion. The only challenge would be downloading and embedding the images in the document, but that is also possible.
将 HTML 转换为 RTF 有多种可能性。 这些链接应该可以帮助您入门:
转换为 MS Word .doc 更加困难并且可能对你来说不值得。 由于这是如此痛苦的原因,请阅读 Joel 关于 .doc 的有趣文章。 如果由于某种原因您必须编写 .doc,COM 与 MSOffice 的互操作可能是您的最佳选择。
There are several possibilities for converting HTML to RTF. These links should get you started:
Converting to MS Word .doc is much harder and probably not worthwhile for you. For the reasons this is such a pain, read Joel's interesting article on .doc. If you have to write .doc for some reason, COM interop with MSOffice is probably your best bet.