当前位置：文江博客话题详情

从图像中识别令人难以置信的/拼字游戏字母

发布于 2024-11-16 21:28:25 字数 1436 浏览 3 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

老旧海报 2024-11-23 21:28:25

这取决于您需要多快。
如果您可以隔离字母的正方形并旋转它，以便包含字母的正方形的边是水平和垂直的，那么我建议您：

将图像转换为黑/白（字母为一种颜色，其余部分为黑色）一个模具另一个
制作所有四个可能方向（即直立和旋转 90、180 和 270 度）的所有字母的参考图像的数据集，
使用模板匹配函数，例如 cvMatchTemplate 从数据集中为每个新图像找到最佳匹配图像

这将需要一些时间。时间，所以优化是可能的，但我认为这会给你一个合理的结果。
如果让它们处于正确的方向很困难，您还可以动态生成新输入的旋转版本，并将其与您的参考数据集进行匹配。

如果字母具有不同的比例，那么我可以想到两个选项：

如果方向不是问题（即您的 boggle 块检测也可以将块置于正确的方向），那么您可以使用具有字母颜色的区域的边界框作为传入图片比例的粗略指标，并将其缩放为与参考图像上的边界框大小相同（每个参考图像可能不同）
如果方向是问题，则只需添加缩放作为您的参考图像的参数搜索空间。因此，您搜索所有旋转（0-360 度）和所有合理的尺寸（您应该能够从您拥有的图像中猜测合理的范围）。

回复收藏 0 原文

咋地 2024-11-23 21:28:25

您可以使用简单的 OCR，例如 Tesseract。它使用简单并且速度相当快。不过，你必须进行 4 次旋转（如@jilles de wit 的答案中所述）。

回复收藏 0 原文

神也荒唐 2024-11-23 21:28:25

我基于 OpenCV 制作了一个 iOS 应用程序来完成此任务。它称为 SnapSolve。我写了一篇关于检测工作原理的博客。
基本上，我在每个形状上覆盖所有 26x4 可能的字母 + 旋转，然后查看哪个字母重叠最多。对此进行一点调整是平滑叠加图像，消除字母几乎重叠但不完全重叠的伪影。

回复收藏 0 原文

~没有更多了~

关于作者

绮烟

暂无简介

0 文章

0 评论

25 人气

关注发私信

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

从图像中识别令人难以置信的/拼字游戏字母

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签