文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
5.10 小结
我们做成了!针对一个十分嘈杂的数据集,构建了一个分类器,然后达到我们的部分目标。当然,我们需要实事求是,把初始的目标调整到可以达成的地方。但是在这个过程中,我们了解到了最邻近和逻辑回归算法的强项和弱点。我们学到了如何提取特征,例如LinkCount 、NumTextTokens 、NumCodeLines 、AvgSentLen 、AvgWordLen 、NumAllCaps 、NumExclams 和NumImages ,以及如何分析它们对分类器性能的影响。
但更有价值的是,我们掌握了一个调试效果较差分类器的好方法。这在未来将帮助我们更快地构建有效的系统。
在深入了解最邻近和逻辑回归算法之后,在下一章里我们将会进一步学习另一个简单而强大的分类算法:朴素贝叶斯。在这个过程中,我们还会学到如何使用Scikit-learn里一些更便捷的工具。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论