pdfbox 或 itextsharp 或 pdfsharp 可以读取损坏的 pdf 文件吗

发布于 2024-08-14 05:49:27 字数 102 浏览 4 评论 0原文

我最近下载了 pdf 库( pdfbox、pdfsharp、itextsharp),我想弄清楚我可以在 Asp.Net 中解析损坏的 pdf 文件吗? 哪个库最适合读取损坏的 pdf 文件。

I recently downloaded pdf libraries ( pdfbox, pdfsharp, itextsharp), and I am trying to figure out can i parse corrupted pdf files with in Asp.Net.
which lib is best for reading corrupted pdf file.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

只是一片海 2024-08-21 05:49:27

如果文件损坏,则无法保证可以读取它。您无法知道哪个或哪些部分已损坏。您可以使用十六进制编辑器实用程序并手动检查哪些部分可能已损坏,但无法使用您提到的任何库来打开损坏的文件。它们都遵循 PDF 规范,该规范假定 PDF 文件有效。

If the file is corrupt, there is no guaranteed way to read it. You cannot know which part or parts are corrupt. You could use a hex editor utility and manually inspect which parts might be corrupted, but there is no way to use any of the libraries you mentioned to open a corrupted file. They all work off the PDF specification, which assumes a valid PDF file.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文