使用c#将pdf转换为html/xml
我想使用 c#将 pdf 转换为 html... 任何人都可以提供任何想法..
I want to convert pdf to html using c#...
Can anyone please give any ideas..
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
编辑(原始包含从 html 到 pdf 的链接,而不是相反):
通过 Google,我给你找到了这个,它很接近(生成文本)。它应该给你一个起点。在 asp.net 上的这个帖子中,它解释了如何使用该技术(跳至代码示例)。
并且,在 SO 上,搜索此 pdf-to-html 标签,您将< a href="https://stackoverflow.com/questions/277901/in-asp-net-what-is-the-best-way-to-convert-a-pdf-file-to-html/277971">查找这篇文章。查看 iTextSharp 的链接,它将为您提供 PDF 文档的界面。
Edit (original contained link to html to pdf, not the other way around):
With Google, I got you this, which is close (generates text). It should give you a starting point. In this thread on asp.net, it explained how you can get HTML using that technique (skip to the code example).
And, on SO, have a search for this pdf-to-html tag, and you'll find this post. Check out the link for iTextSharp, which'll give you an interface to the PDF document.