pdfbox 或 itextsharp 或 pdfsharp 可以读取损坏的 pdf 文件吗
我最近下载了 pdf 库( pdfbox、pdfsharp、itextsharp),我想弄清楚我可以在 Asp.Net 中解析损坏的 pdf 文件吗? 哪个库最适合读取损坏的 pdf 文件。
I recently downloaded pdf libraries ( pdfbox, pdfsharp, itextsharp), and I am trying to figure out can i parse corrupted pdf files with in Asp.Net.
which lib is best for reading corrupted pdf file.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
如果文件损坏,则无法保证可以读取它。您无法知道哪个或哪些部分已损坏。您可以使用十六进制编辑器实用程序并手动检查哪些部分可能已损坏,但无法使用您提到的任何库来打开损坏的文件。它们都遵循 PDF 规范,该规范假定 PDF 文件有效。
If the file is corrupt, there is no guaranteed way to read it. You cannot know which part or parts are corrupt. You could use a hex editor utility and manually inspect which parts might be corrupted, but there is no way to use any of the libraries you mentioned to open a corrupted file. They all work off the PDF specification, which assumes a valid PDF file.