返回介绍

12.4 小结

发布于 2024-01-30 22:34:09 字数 603 浏览 0 评论 0 收藏 0

我们看到了如何使用Jug——一个小型Python框架——来管理那些利用了多核或多主机的计算。尽管这个框架是通用的,但它是特地为解决其作者(也是本书作者之一)的数据分析需求而构建的。因此,它有一些方面很适合Python机器学习环境。

我们还学习了AWS——亚马逊云。使用云计算通常会比构建内部计算环境能更有效地利用资源。如果需求不是固定的而是变化的,那更是如此。starcluster甚至允许集群在你开启更多作业的时候自动扩展,在它们终止的时候收缩。

这是本书的结尾,我们已经走了很长一段路。我们了解到当有标注数据的时候如何进行分类,以及当没有的时候如何进行聚类。我们学习了关于降维和主题模型的知识,它们对大规模数据集是有意义的。在本书的最后几章,我们看了一些具体应用,例如音乐体裁分类和计算机视觉。对于实现,我们主要依赖于Python。这个语言拥有一个建立在NumPy之上的,不断增长的数值计算程序包扩展生态系统。在任何可能的时候,我们都会使用Scikit-learn,但也会在必要的时候使用其他程序包。基于它们都使用相同基础数据结构的事实,我们可以无缝混合来自于不同包的功能。所有在本书里使用的程序包都是开源的,可以用于任何项目。

自然,我们无法涵盖机器学习的所有话题。所以,在附录里,我们提供了一系列精选资源,帮助读者学习更多机器学习方面的知识。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文