当前位置：文江博客话题详情

去除 OCR 图像处理中的背景颜色

发布于 2024-10-29 01:55:34 字数 336 浏览 13 评论 0原文

我正在尝试删除背景颜色，以提高 OCR 对图像的准确性。示例如下所示：

在此处输入图像描述

我会保留后处理图像中的所有字母，同时删除浅紫色带纹理的背景。是否可以使用一些开源软件如Imagemagick将其转换为二值图像（黑/白）来实现这一目标？如果背景有不止一种颜色怎么办？解决方案会一样吗？

此外，如果我还想删除紫色字母（剧院名称）和线条，只保留黑色字母，该怎么办？简单的裁剪可能不起作用，因为紫色字母也可能出现在其他地方。

我正在寻找编程解决方案，而不是通过 Photoshop 等工具。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

此生挚爱伱 2024-11-05 01:55:34

您可以使用 GIMP（或任何其他图像编辑工具）来完成此操作。

打开图像
转换为灰度
复制图层
使用大内核 (10x10) 将高斯模糊应用到顶层
计算顶层和底层之间的图像差异对
图像进行阈值以生成二值图像

模糊图像：

在此处输入图像描述

差异图像：

输入图像描述这里

二进制：

在此处输入图像描述

如果您只是一次性执行此操作，GIMP 可能就足够了。如果您希望多次执行此操作，您可能可以编写一个 imagemagick 脚本或使用 Python 和 OpenCV 等工具编写您的方法。

上述方法的一些问题：

紫色文本 (CENTURY) 会丢失，因为它与其他文本的对比度不一样。您可以通过对图像的不同部分进行不同的阈值处理，或者使用本地直方图操作方法来解决这个问题

回复收藏 0 原文

后知后觉 2024-11-05 01:55:34

下面显示了处理图像及其 OCR 的可能策略

最后一步是进行 OCR。我的 OCR 例程非常基础，所以我相信您可能会得到更好的结果。

该代码是 Mathematica 代码。

在此处输入图像描述

一点也不差！

回复收藏 0 原文

樱桃奶球 2024-11-05 01:55:34

在 Imagemagick 中，您可以使用 -lat 函数来执行此操作。

convert image.jpg -colorspace gray -negate -lat 50x50+5% -negate result.jpg

convert image.jpg -colorspace HSB -channel 2 -separate +channel \
-white-threshold 35% \
-negate -lat 50x50+5% -negate \
-morphology erode octagon:1 result2.jpg

In Imagemagick, you can use the -lat function to do that.

convert image.jpg -colorspace gray -negate -lat 50x50+5% -negate result.jpg

convert image.jpg -colorspace HSB -channel 2 -separate +channel \
-white-threshold 35% \
-negate -lat 50x50+5% -negate \
-morphology erode octagon:1 result2.jpg

回复收藏 0 原文

牛↙奶布丁 2024-11-05 01:55:34

您可以对图像应用模糊，这样您就可以获得几乎清晰的背景。然后将原始图像每个像素的每个颜色分量除以背景上像素的相应分量。您将在白色背景上看到文本。额外的后处理可以提供进一步的帮助。

如果文本比背景（在每个颜色分量中）暗，则此方法适用。否则，您可以反转颜色并应用此方法。

回复收藏 0 原文

我的影子我的梦 2024-11-05 01:55:34

如果您的图像被捕获为 RGB，只需使用绿色图像或快速转换拜耳模式，这可能是 @misha 转换为灰度解决方案可能可以。

回复收藏 0 原文

虐人心 2024-11-05 01:55:34

希望这对某人有帮助

使用您可以获得的一行代码是使用 OpenCV 和 python

#Load image as Grayscale
im = cv2.imread('....../Downloads/Gd3oN.jpg',0)
#Use Adaptivethreshold with Gaussian
th = cv2.adaptiveThreshold(im,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)

这是结果

这是图像阈值

Hope this helps someone

Using one line code you can get is using OpenCV and python

#Load image as Grayscale
im = cv2.imread('....../Downloads/Gd3oN.jpg',0)
#Use Adaptivethreshold with Gaussian
th = cv2.adaptiveThreshold(im,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)

Here's the result

Here's the link for Image Thresholding in OpenCV

回复收藏 0 原文

~没有更多了~