当前位置：文江博客话题详情

ocr image-scanner image-processing text-recognition

提高扫描文档的 OCR 准确性

发布于 2024-10-11 07:09:35 字数 310 浏览 8 评论 0原文

我使用标准 Brother A3 多功能一体机扫描大量 A3 文档，然后使用 FineReader Pro 对图像进行 OCR 处理。

但是，我在识别的字符中遇到很多错误，以及很多非字母数字的奇怪字符。

有人可以给我一些以编程方式提高 OCR 准确性的提示，无论是对扫描图像进行预处理，还是对识别文本进行后处理？

编辑：查找示例 pdf。它包括一些示例图像，我从中得到了最差的结果。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

千と千尋 2024-10-18 07:09:35

您是否有可以发布在某处的示例图像，然后我们可以快速告诉您导致大多数问题的原因。 FineReader 是目前最好的 OCR 引擎之一，因此您的结果不佳肯定是有原因的。

这可能与对比度和阈值设置不佳、图像倾斜、扫描仪中的脏滚筒、复杂且彩色的背景、抖动背景、字体大小太小、扫描 dpi 太低等有关......

看到所附图像后，有一个几个小问题。

背景页上有很多脏斑点。 FineReader 似乎在您的图像上对此做了合理的工作。
存在一些轻微的偏差，但这不会导致问题。
FineReader 与用于列标题的粗体高 Arial 字体混淆。
4 一个大问题似乎是页面底部区域的对比度较差且图像模糊。这似乎是扫描仪的问题，但也可能是由于打印问题造成的。

印刷质量很差，我猜这是报纸的扫描件。大多数错误都是由于扫描问题造成的，因此很难以编程方式改进结果。

首先，我会尝试使用稍高的分辨率扫描灰度图像，看看是否有帮助。 FineReader 可以很好地处理灰度图像。如果您必须有黑白图像，请查看扫描仪驱动程序是否包含动态阈值设置并将其打开。

对于任何 OCR 引擎来说，获取图像都不是一件容易的事。如果您可以改进扫描，您将获得更好的结果。第 3 页右下角有很多噪音。

您使用的是哪个版本的 FineReasder？ FR10 可能会比以前的版本提供更好的结果。

回复收藏 0 原文

~没有更多了~

关于作者

〗斷ホ乔殘χμё〖

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

╰ゝ天使的微笑

文章 0 评论 0

少女净妖师

文章 0 评论 0

朱洁

文章 0 评论 0

觉浅

文章 0 评论 0

滥情空心

文章 0 评论 0

hl1314520

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文