训练 tesseract 与 iPhone 一起使用

发布于 2024-09-07 15:18:08 字数 539 浏览 4 评论 0原文

我正在尝试在我的 iPhone 应用程序中使用 tesseract-2.04,只想检测数字。我在这里所做的首先是使用这篇文章交叉编译tesseract以生成lib文件 http://robertcarlsen.net/2009/07/15/cross-compiling-for-iphone-dev-884,然后使用 http://robertcarlsen.net/2010/01/12/ocr-for-iphone- source-1080 ,但结果远不现实。

我无法解决这个问题或如何训练超正方体以使其在实际使用中关闭。

请帮忙。

谢谢,

马杜普

I am trying to use tesseract-2.04 in my iPhone application and just want to detect the numbers. What I am doing here is first I am cross compiling tesseract to generate lib file using this post http://robertcarlsen.net/2009/07/15/cross-compiling-for-iphone-dev-884 and then using the the demo application at http://robertcarlsen.net/2010/01/12/ocr-for-iphone-source-1080 , but the results far away than realistic.

I am not able to resolve the issue or how to train tesseract so that it comes closure for practical usage.

Please help.

Thanks,

Madhup

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

剧终人散尽 2024-09-14 15:18:08

我得到了相当好的结果设置,

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

同时轻轻地敦促用户让数字适合某个盒子。这使我更容易找到数字,并确保用户保持图像稳定并保持在合理的距离,从而获得更清晰的图像。

我曾考虑过更改 tesseract-2.04/dict/permute.cpp 中的 valid_word() ,但似乎没有必要。

下一步将是硬编码最小/最大字符大小,以便识别时间可以远小于现在的 500 毫秒。那么下一步将是添加一些及时跟踪结果的代码,以便 90% 的时间读取 5 ,只有 10% 的时间读取 8 会引导代码记住5

这完全取决于您的用例。我很幸运,因为我可以只显示一个 200x50 的盒子,其中包含该号码。

I get quite good results setting

TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");

while gently urging the user to let the numbers fit in a certain box. This makes locating the numbers easier for me, and ensures the user keeps the image steady and at a reasonable distance leading to a sharper image.

I have thought about altering valid_word() in tesseract-2.04/dict/permute.cpp, but there seems to be no need for that.

The next step will be to hardcode a minimum/maximum char size so recognition time can become way less than the 500 ms it is now. Then the next step will be to add some code that keeps track of results in time, so that reading 5 90% of the time and 8 only 10% will lead the code to remember the 5.

It all depends on the use case you have. I'm lucky in the sense that I'm allowed to just show a 200x50 box which will contain the number.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文