从大型数据集中识别被遮挡的纹理块

发布于 2024-11-29 19:59:02 字数 407 浏览 3 评论 0原文

我手头的假设任务是能够从上面一张几何形状不失真的饮料罐图片中给出其分类（例如饮料的品牌和名称）。不需要分段。分类函数的输入只是罐头任一侧面的一个视图，一个视图。数据集应该很大，大约有 2000 种不同的饮料。所有罐头的尺寸都相同。为了进行训练，每个罐子都会旋转数百次以涵盖几乎任何角度。

有什么想法解决这个问题的最佳方法吗？对我来说，这似乎是一个纹理识别问题，其中物体本身的形状无关。分类也应该很快，因此排除了模板匹配。如果有人能为我指出正确的方向，那将是向前迈出的一大步。我想出的想法似乎都不适合这项任务。局部特征（SIFT/SURF）等？太一般了。一个品牌可以在其生产的不同饮料上使用相同的徽标。神经网络？罐子的不同侧面看起来可能非常不同，如果它们都映射到相同的标签，这将会扰乱训练。词袋？用于训练 SVM 的 HOG/颜色直方图等？也许是一些我不知道、我不知道的完全不同的东西？

原文

分享到QQ

分享到微博