Tessnet的优化配置——图像格式转换够好吗?
我需要对一组图像进行 OCR。我一直在使用 Tessnet,效果很好。问题是它似乎对某些图像有问题,所以我认为如果我修改图像的亮度、对比度等,效果可能会更好。另外,图像是.jpg格式,但我读到.tiff是最佳的。
我能做些什么?我应该将 JPEG 转换为 TIFF 吗?
I need to do OCR on a group of images. I have been using Tessnet and it works pretty well. The problem is that it seems to have problems with some images, so I thought that it might work better if I modify the images' brightness, contrast, etc. Also, the images are in .jpg format, but I read that .tiff is optimal.
What can I do? Should I just convert the JPEGs to TIFFs?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
将 jpeg 图像转换为 tiff 等无损格式是没有意义的,您也会转换伪像。在尝试对图像进行 ocr 之前,您可以尝试在图像上应用锐度内核。
请参阅此页面了解更多信息。
There's no point in converting the jpeg images to a lossless format like tiff, you will convert the artifacts as well. You could try and apply a sharpness kernel on the image before you try to do ocr on it.
Look at this page for more information.