使用 VB.net 将 PDF 转换为文本文件

发布于 2024-08-06 06:42:49 字数 57 浏览 5 评论 0原文

我有一个扫描的 PDF 文件,我需要一个 VB.net 源代码,它将扫描的 PDF 转换为文本格式。

I have a Scanned PDF Files , i need a VB.net Source Code which convert that scanned PDF to text Format.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

锦爱 2024-08-13 06:42:49

扫描的文件很可能没有文本,只有图像,因此您必须使用 OCR 工具来提取文本。

有几个 OCR 库,例如

开源 OCR

https://stackoverflow.com/questions/1085/free-ocr-library

Most likely the scanned file will not have the text but an image so you have to look at an OCR tool to get the text out.

There are several OCR libraries out there like

Open source OCR

https://stackoverflow.com/questions/1085/free-ocr-library

夕色琉璃 2024-08-13 06:42:49

看一下 http://snipt.org/lOgh/ - 它是用 C# 编写的(应该相对容易在 VB.NET 中重写),并使用可通过 API 访问的托管 OCR 解决方案

Take a look at http://snipt.org/lOgh/ - it's in C# (should be relatively easy to rewrite in VB.NET), and uses a hosted OCR solution accessible through an API

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文