文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
第 9 章 概率与统计
概率论和统计学的研究对象是随机现象,主要是随机抽样形式的随机现象,比如随机数和随机分类变量。
概率论关注随机样本的来源和产生。我们通过适当的概率分布得到随机样本,并将它们用于:
模拟合成原始数据,并用于模型测试(就像我们在第30单元中所做的)
将原始数据分解成测试集和训练集(参见第48单元)
支持随机机器学习算法(比如第51单元中的随机决策森林)
另一方面,统计学则主要研究已收集的随机样本的属性。实验的原始数据几乎总是具有不确定性和不可预测性。我们将使用各种统计度量来描述因变量的观测值以及因变量和自变量之间的相互作用。
概率论和统计学都是具有丰富内涵和外延的数学领域。要学习它们的话,不能只阅读一本参考书中的一个章节。事实上,你可能已经对概率论和统计学有了一定的了解。本书的这部分内容只是对关键概念的简单回顾和总结。我们首先回顾一些概率理论,进而给出各种统计度量的数学定义,最后用Python的方式计算它们。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论