在 OpenCV 中实现词汇树

发布于 2024-11-04 04:51:40 字数 254 浏览 10 评论 0原文

我正在尝试基于论文“Scalable Recognition with a Vocabulary Tree”来实现图像搜索。我正在使用 SURF 来提取特征和关键点。例如，对于一张图像，我得到 300 个关键点，每个关键点有 128 个描述符值。我的问题是如何在数据上应用 K 均值聚类算法。我的意思是我是否需要对所有点（即 300*128 值）应用聚类算法，或者我是否需要找到连续描述符值之间的距离并存储这些值并对其应用聚类算法。我很困惑，任何帮助将不胜感激。

谢谢，洛基。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

残疾 2024-11-11 04:51:40

从你的问题来看，我想说你很困惑。词汇树技术基于使用 k-means 分层聚类和叶节点的 TF-IDF 加权方案。

简而言之，用于构建词汇树的聚类算法对所有 d 维 数据（对于 SIFT 的情况，d=128）运行一次 k 均值，然后对每个获得的簇再次运行 k 均值，直到某个深度级别。因此，词汇树构建的两个主要参数是分支因子k和树深度L。一些改进仅考虑分支因子，而深度是通过切割树来自动确定的，以满足最小方差度量。

至于实现，OpenCV 的 cv::BOWTrainer 是一个很好的起点，但对于分层 BoW 方案的情况并没有很好的概括，因为它强制将中心存储在一个简单的 中。 >cv::Mat 虽然词汇树通常是不平衡的，并且当节点数量远低于理论数量时，从内存使用的角度来看，以逐级方式将其映射到矩阵可能效率不高深度L和分支因子k的平衡树中的节点数，即：

n << (1-k^L)/(1-k)

回复收藏 0 原文

扶醉桌前 2024-11-11 04:51:40

据我所知，我认为您必须将所有描述符存储在 cv::Mat 上，然后将其添加到“Kmeans Trainer”中，这样您最终就可以应用聚类算法。这里有一个片段可以让您了解我在说什么：

BOWKMeansTrainer bowtrainer(1000); //num clusters
bowtrainer.add(training_descriptors); // we add the descriptors
Mat vocabulary = bowtrainer.cluster(); // apply the clustering algorithm

这可能会让您感兴趣：http://www.morethantechnical.com/2011/08/25/a-simple- object-classifier-with-bag-of-words-using-opencv-2-3-w-code/

祝你好运！

For what I know I think that you have to store all the descriptors on a cv::Mat and then add this to a "Kmeans Trainer", thus you can finally apply the clustering algorithm. Here a snippet that can give you an idea about what I am talking:

BOWKMeansTrainer bowtrainer(1000); //num clusters
bowtrainer.add(training_descriptors); // we add the descriptors
Mat vocabulary = bowtrainer.cluster(); // apply the clustering algorithm

And this maybe can be interesting to you: http://www.morethantechnical.com/2011/08/25/a-simple-object-classifier-with-bag-of-words-using-opencv-2-3-w-code/

Good luck!!

回复收藏 0 原文