返回介绍

5.10 小结

发布于 2024-01-30 22:34:09 字数 395 浏览 0 评论 0 收藏 0

我们做成了!针对一个十分嘈杂的数据集,构建了一个分类器,然后达到我们的部分目标。当然,我们需要实事求是,把初始的目标调整到可以达成的地方。但是在这个过程中,我们了解到了最邻近和逻辑回归算法的强项和弱点。我们学到了如何提取特征,例如LinkCount 、NumTextTokens 、NumCodeLines 、AvgSentLen 、AvgWordLen 、NumAllCaps 、NumExclams 和NumImages ,以及如何分析它们对分类器性能的影响。

但更有价值的是,我们掌握了一个调试效果较差分类器的好方法。这在未来将帮助我们更快地构建有效的系统。

在深入了解最邻近和逻辑回归算法之后,在下一章里我们将会进一步学习另一个简单而强大的分类算法:朴素贝叶斯。在这个过程中,我们还会学到如何使用Scikit-learn里一些更便捷的工具。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文