当前位置：文江博客话题详情

PDF ocr tesseract multipage

tesseract ocr 多页 pdf 挂起

发布于 2024-11-19 20:06:22 字数 229 浏览 7 评论 0原文

我们正在使用 Tesseract 的 Java 库（称为 Tess4j）将 PDF 文件转换为文本。它可以很好地处理 Tiff 文件以及一页 PDF 文件。但对于多页 PDF，它确实会生成输出文件，当涉及到最后一页时，控件似乎不会返回到调用 doOCR 调用的原始应用程序。它只是停留/挂在那里而不做任何事情。是否是本机调用未返回的问题。我不知道，

如果有此问题的解决方案，请尽快告诉我。

问候
维什

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

蓝眸 2024-11-26 20:06:22

Tess4J 支持多页 PDF 和多页 TIFF。在单元测试用例中替换为您的 PDF 文件并尝试一下。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

天天爱笑的徐老师

文章 0 评论 0

星

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文