存在相机抖动时的基准标记检测

发布于 2025-01-06 14:13:13 字数 562 浏览 1 评论 0原文

当用户剧烈移动相机（手机）时，我试图使基于 OpenCV 的基准标记检测更加稳健。标记采用 ArTag 风格，并在黑色边框内嵌入汉明码。通过对图像进行阈值处理来检测边界，然后根据找到的轮廓查找四边形，然后检查四边形的内部。

一般来说，如果黑色边框被识别，标记的解码就相当稳健。我尝试过最明显的方法，即对图像进行两次下采样，并在这些级别上执行四重检测。这有助于相机在极端近地标记上散焦，并且图像模糊程度非常小，但对相机运动模糊的一般情况没有很大帮助

是否有关于使检测更加鲁棒的方法的研究？我想知道的想法包括：

您可以进行某种光流跟踪来“猜测”下一帧中标记的位置，然后在这些猜测的区域中进行某种角点检测，而不是处理矩形搜索作为全帧阈值？
在 PC 上，是否可以导出模糊系数（也许通过与检测到标记的最近视频帧进行配准）并在处理之前对图像进行去模糊？
在智能手机上，是否可以使用陀螺仪和/或加速度计来获取去模糊系数并对图像进行预处理？（我假设不是，只是因为如果是的话，市场上将充斥着抖动校正相机应用程序。）

如果失败的想法的链接可以帮助我避免尝试它们，那么我也将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

挽梦忆笙歌 2025-01-13 14:13:13

是的，您可以使用光流来估计标记可能在哪里并定位您的搜索，但这只是重新定位，您的跟踪将因模糊帧而中断。
我对去模糊了解不多，只是说它的计算量很大，所以实时可能很困难
你可以使用传感器来猜测你面临的模糊类型，但我猜去模糊对于移动设备来说计算量太大实时设备。

然后是其他一些方法：

这里有一些非常聪明的东西： http: //www.robots.ox.ac.uk/~gk/publications/KleinDrummond2004IVC.pdf 他们正在进行边缘检测（可用于查找您的标记）边界，即使您现在正在寻找四边形），对来自传感器的相机运动进行建模，并使用这些值来估计给定帧速率的模糊方向上的边缘应如何出现，并进行搜索。非常优雅。

同样这里 http://www.eecis.udel.edu/~jye /lab_research/11/BLUT_iccv_11.pdf 他们只是预先模糊跟踪目标，并尝试匹配给定模糊方向的适当模糊目标。他们使用高斯滤波器来模拟模糊，这是对称的，因此您需要的预模糊目标数量是您最初预期的一半。

如果您确实尝试实施其中任何一个，我真的很想听听您的进展如何！

回复收藏 0 原文