如何提高tesseract识别数字的结果

发布于 2024-10-09 13:27:24 字数 800 浏览 16 评论 0原文

我正在开发可识别 ISBN 号码的 iPhone 应用程序（ISBN：978-83-7380-900-0）我为此使用了 tesseract，但效果不是很好。我可以看到其他应用程序，使用相同的引擎可以更好地工作。

为了限制字符，我使用此配置行： tess->SetVariable("tessedit_char_whitelist", "SN:0123456789X-"); 所以所有的“I”都被转换为“1”，“B”被转换为8。使用这个它不会对这些字母犯错误，这对我来说并不重要。之后，我使用正则表达式来查找已识别文本的正确部分。

我还裁剪了图像，因此 tesseract 仅识别图像的一部分，其中 isbn 可见（我将颜色矩形放置在相机覆盖层上，因此用户必须将代码放置在正确的位置）我还将图像大小调整为 1000px 宽度（也尝试了其他尺寸），

当光线很好时效果很好，但当光线不完美时很难正确识别。

isbn 号的最后一位是控制和。

我能做些什么来让它更好地工作？有没有办法说 tesserect 仅识别给定正则表达式中的文本？也许我应该先对图像做一些事情？

无法正确识别的示例图像：
http://img412.imageshack.us/i/img0367si.jpg/
http://img264.imageshack.us/i/img0361d.jpg/

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

嘿哥们儿 2024-10-16 13:27:24

我使用了一些预处理，目前结果相当不错。（归一化和自动阈值）我用 iPhone 的简单图像处理来做到这一点。我还用 2 倍变焦制作图像。
唯一的问题是，很容易产生模糊图像，然后就无法识别任何东西。
ocr识别过程大约需要4s。它适用于 300 x 109 的图像：19KB
我只是想知道我能做些什么让它工作得更快，这样我就可以拍摄几张图像并处理所有它们。

回复收藏 0 原文

~没有更多了~