当前位置：文江博客话题详情

从原始视频中获取运动向量

发布于 2024-10-31 20:10:01 字数 258 浏览 1 评论 0原文

我想知道是否有任何关于如何获取原始视频流中宏块的运动向量的好的（并且免费提供的）文本。这经常用于视频压缩，尽管我的应用不是视频编码。

OSS 编解码器中提供了执行此操作的代码，但通过阅读代码来理解该方法有点困难。

我的实际目标是确定相机在 2D 投影空间中的运动，假设相机仅改变其方向（而不是位置）。我想做的是将帧划分为宏块，获取它们的运动向量，并通过平均这些向量来获取相机运动。

我想 OpenCV 可以帮助解决这个问题，但它在我的目标平台上不可用。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小草泠泠 2024-11-07 20:10:01

通常的方法是简单的强力：将宏块与参考帧中的每个宏块进行比较，并使用给出最小残余误差的宏块。代码变得复杂主要是因为这通常是基于 mv 的压缩中最慢的部分，因此他们投入了大量的工作来优化它，通常以牺牲任何甚至接近可读性为代价。

特别是对于实时压缩，有些通过（例如）将搜索限制在原始位置+/-某个最大增量来稍微减少工作量。这通常可以获得相当多的压缩速度，以换取相当小的压缩损失。

回复收藏 0 原文

白首有我共你 2024-11-07 20:10:01

如果您仅假设相机运动，我怀疑对连续图像的 FFT 进行分析是可能的。对于幅度变化不大的频率，相位信息将指示相机运动。不确定这是否有助于相机旋转，但可能可以计算横向和垂直运动。由于新信息出现在一个边缘而在另一边缘消失，将会出现困难，我不确定这会造成多大的伤害。这是对你的问题的推测性思考，所以我没有证据或参考:-)

回复收藏 0 原文

女中豪杰 2024-11-07 20:10:01

听起来您正在做一个非常有限的 SLAM 项目？

布里斯托大学有很多阅读材料，帝国理工学院，牛津大学 - 您可能会发现他们在帧与帧之间查找和匹配候选特征的方法利息——比绝对差值的简单求和更加稳健。

回复收藏 0 原文

初见你 2024-11-07 20:10:01

对于这种类型的最低级算法，您要查找的术语是光流该类最简单的算法之一是 Lucas Kanade 算法。

<一href="https://crypted.google.com/url?sa=t&source=web&cd=2&ved=0CCEQFjAB&url=http://www.dcc.fc.up.pt/~mcoimbra/讲座/VCS_0708/VCS%252 02008%2520-%252010%2520-%2520Optical%2520Flow.pdf&ei=QQ-nTYb3O9GbOonblNI J&usg=AFQjCNEx4s1UYHFIe_FNAQH5hB5cREvcQg&sig2=XOmp-MwiVp3I0C-RLRiOjg" rel="nofollow">这是一个非常好的概述演示，它应该为您提供很多关于满足您需要的算法的想法

回复收藏 0 原文

~没有更多了~