当前位置：文江博客话题详情

仿射变换、简单旋转和缩放还是其他什么？

发布于 2024-12-10 14:02:19 字数 945 浏览 0 评论 0原文

场景是这样的：我有一张论文的图片，我想对其进行 OCR 处理。因此，以下面的图像作为我的输入示例：

orig_image

成功检测到与我留下的纸张相对应的区域后一个包含 4 个坐标的向量，用于定义其在图像内的位置。请注意，由于拍摄照片时相机的距离和角度，这些坐标可能不会对应于完美的矩形。出于查看目的，我连接了子图像中的点，以便您可以明白我的意思：

Detected_image

在这种情况下，点是： [1215, 43] 、 [52, 67] 、 [56, 869] 和 [1216, 884]

此时，我需要调整这些点，使它们对齐水平地。我这么说是什么意思？如果您注意到上面子图像的区域，它会稍微旋转：图像右侧的点位置比另一侧的点稍高。

换句话说，我们有图像 A，故意夸张，看起来比现实更扭曲/旋转，然后是图像 B - 这就是我想要的作为此过程的最终结果：

A) bad_rect B) ok_rect

我不确定可以使用哪些技术来实现这种转换。该应用程序还需要自动检测需要完成多少旋转，因为我无法控制图像采集过程。

目的是获得一个带有标准化子图像的新Mat。我现在并不担心可能的图像失真，我只是在寻找一种方法来确定子图像需要进行多少旋转以及如何应用它并获得更多的矩形区域< /em>.

需要登录才能够评论，你可以免费注册一个本站的账号。

一场春暖 2024-12-17 14:02:19

我认为 http://felix.abecassis.me/2011/10/opencv-旋转校正/ 和 http://felix.abecassis.me/2011/10/opencv- bounding-box-skew-angle/ 会派上用场。上述帖子不涉及透视变形（仅旋转）。要获得最佳结果，您必须使用 warpPerspective（也许与getRotationMatrix2D结合使用）。使用线段之间的角度来找出需要扭曲透视的程度。这里的假设是它们应该始终为 90 度，并且就透视而言，最接近 90 度的向量是“最接近”的向量。

不要忘记标准化你的向量！