文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
10.3 在更难的数据集上分类
前面这个数据集是一个用纹理特征分类的简单数据集。事实上,很多从商业角度看来很有趣的问题,其实是相对容易解决的。有时我们会面对更加困难的问题,需要使用更好更多的先进技术才能得到好结果。
我们现在来测试一些具有相同结构的公共数据集:某些类别的照片。这些类别包括动物、汽车、交通运输和自然景色。
与之前讨论的三分类问题相比,这些类别更加难以区分。自然风景、建筑物和文字具有截然不同的纹理。但在这个数据集里,纹理并不是类别的明显标志。下面是动物类别的一个例子:
这是另一张汽车类别的图像:
两张图片都有自然背景,图像里都有较大的平滑区域。因此我们可以认为,纹理并不能很好区分它们。
如果使用跟之前一样的特征,我们用逻辑回归在交叉验证中就可以得到55%的正确率。对于4个类别来说,这并不是太坏,但也不是特别好。让我们看看是否可以用一个不同的方法做得更好。事实上,我们可以看到,我们需要把纹理特征和其他方法组合起来,才可能得到最好的结果。但是,要事第一——我们看一看局部特征。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论