当前位置：文江博客话题详情

tesseract-ocr的问题。我装好后下了个英文文章，可以识别出来，但是我自己做了一个主是四个数字的验证码却输出是空

发布于 2022-09-06 20:27:36 字数 351 浏览 31 评论 0

费了好大的劲装好了tesseract-ocr 真的好坑这个东西
python层面的包我也装好好几个 tesserorc , pytesser, pytsseract

网上资料极其乱，我到现在都不明白在PYTHON层面上上面这三个包有啥区别。

然后以为可以了，自己做了一个最简单的验证码，就是白底黑字四个数字，居然输得出empty page 崩溃了
折腾了好久。都不明白为啥难道这么简单的都识别不了？
然后我弄了个纯英文的文章，满长的，在那跑了好久居然全给识别出来了。我晕了

难道tesseract-ocr的 tessdata里面没有数字识别？

大佬们这要咋办，这种情况该怎么处理了有点蒙了

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

手心的海 2022-09-13 20:27:36

命令tesseract imagename outputbase digits只识别数字，不过如果是验证码的数字估计识别出来是空，因为有噪声和倾斜，需要先使用jTessBoxEditor工具训练

回复收藏 0

~没有更多了~

关于作者

和影子一齐双人舞

暂无简介

文章

27 人气

关注发私信

櫻之舞

文章 0 评论 0

关注

弥枳

文章 0 评论 0

关注

m2429

文章 0 评论 0

关注

寻找一个思念的角度

文章 0 评论 0

关注

野却迷人

文章 0 评论 0

关注

我怀念的。

文章 0 评论 0

友情链接

文江博客

tesseract-ocr的问题。我装好后下了个英文文章，可以识别出来，但是我自己做了一个主是四个数字的验证码却输出是空

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞