提升Tesseract OCR準確度?
我想请教一下,我想在android上做一个关于读取名片转成通讯录的app,我用tesseract-ocr,我爬文发现要提高ocr的准确度应该先train一些样品。
我的问题是:如果这个app要能读取所有的名片,我是不是要train所有样式的名片?名片这东西有很多不同格式....如果要train所有样式的名片要花很多时间...
除了train,还有其他提高准确度的方法吗?如果要做图像处理,有什么建议给我呢?
我表达得不太好...万分感谢你的帮忙!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
名片识别,医疗票据识别,等ocr比较细分的领域,需要做大量的样本训练,算法优化,以一个人的精力很难做好
这些开源的OCR其实真的不太好用,其实还是要找商业化的
OCR,可以看看这个:http://www.sjocr.com/