当前位置：文江博客话题详情

如何在图像上拆分连接的字符以进行进一步的OCR？

发布于 2025-01-21 13:17:13 字数 1176 浏览 1 评论 0 原文

onerationimage1

binarizedImage1

ointerimage2 ointerimage2

//i.sstatic.net/hj7mu.png“ rel =“ nofollow noreferrer”> binarizedimage2

binarizedimage3

ointernimage4

“ m在Java（使用OpENCV库）上通过Tesseract（此自定义字体进行了预训练）为OCR准备图像。

有一个带有蓝色文本的图像，在通过OpenCV inrange（）方法进行了图像调整大小和二进制后，我有黑白映像，但是有些字母已连接，Tesseract有时会在其上造成错误。同样，还有更多的问题：原始文本很小，它的边框像素总是具有不同的RGB值，背景也总是不同的。

我试图增加Inrange（）方法捕获的像素数量，但具有更多连接的字符。减少捕获的像素量后，一些字母几乎看不见，Tesseract无法阅读它们。

请告知我如何在二进制图像上用白色将这些角色拆分。还是有更有效地从彩色图像中提取文本的方法？任何文本提取/识别建议都不仅对Tesseract和OpenCV都很好。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

╰つ倒转 2025-01-28 13:17:13

图像上的所有文本都有蓝色。在第一步中，尝试使用此Tesseract用户论坛。它在Python中，但Java可能会有类似的东西。

回复收藏 0 原文

~没有更多了~

关于作者

素食主义者

暂无简介

文章

26 人气

关注发私信

tomoekana

文章 0 评论 0

关注

无边思念无边月

文章 0 评论 0

关注

眼角的笑意。

文章 0 评论 0

关注

在风中等你

文章 0 评论 0

关注

是你

文章 0 评论 0

关注

syong71

文章 0 评论 0

友情链接

文江博客

如何在图像上拆分连接的字符以进行进一步的OCR？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签