文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
12.4 小结
我们看到了如何使用Jug——一个小型Python框架——来管理那些利用了多核或多主机的计算。尽管这个框架是通用的,但它是特地为解决其作者(也是本书作者之一)的数据分析需求而构建的。因此,它有一些方面很适合Python机器学习环境。
我们还学习了AWS——亚马逊云。使用云计算通常会比构建内部计算环境能更有效地利用资源。如果需求不是固定的而是变化的,那更是如此。starcluster甚至允许集群在你开启更多作业的时候自动扩展,在它们终止的时候收缩。
这是本书的结尾,我们已经走了很长一段路。我们了解到当有标注数据的时候如何进行分类,以及当没有的时候如何进行聚类。我们学习了关于降维和主题模型的知识,它们对大规模数据集是有意义的。在本书的最后几章,我们看了一些具体应用,例如音乐体裁分类和计算机视觉。对于实现,我们主要依赖于Python。这个语言拥有一个建立在NumPy之上的,不断增长的数值计算程序包扩展生态系统。在任何可能的时候,我们都会使用Scikit-learn,但也会在必要的时候使用其他程序包。基于它们都使用相同基础数据结构的事实,我们可以无缝混合来自于不同包的功能。所有在本书里使用的程序包都是开源的,可以用于任何项目。
自然,我们无法涵盖机器学习的所有话题。所以,在附录里,我们提供了一系列精选资源,帮助读者学习更多机器学习方面的知识。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论