返回介绍

10.3 在更难的数据集上分类

发布于 2024-01-30 22:34:09 字数 726 浏览 0 评论 0 收藏 0

前面这个数据集是一个用纹理特征分类的简单数据集。事实上,很多从商业角度看来很有趣的问题,其实是相对容易解决的。有时我们会面对更加困难的问题,需要使用更好更多的先进技术才能得到好结果。

我们现在来测试一些具有相同结构的公共数据集:某些类别的照片。这些类别包括动物、汽车、交通运输和自然景色。

与之前讨论的三分类问题相比,这些类别更加难以区分。自然风景、建筑物和文字具有截然不同的纹理。但在这个数据集里,纹理并不是类别的明显标志。下面是动物类别的一个例子:

这是另一张汽车类别的图像:

两张图片都有自然背景,图像里都有较大的平滑区域。因此我们可以认为,纹理并不能很好区分它们。

如果使用跟之前一样的特征,我们用逻辑回归在交叉验证中就可以得到55%的正确率。对于4个类别来说,这并不是太坏,但也不是特别好。让我们看看是否可以用一个不同的方法做得更好。事实上,我们可以看到,我们需要把纹理特征和其他方法组合起来,才可能得到最好的结果。但是,要事第一——我们看一看局部特征。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文