返回介绍

第 9 章 概率与统计

发布于 2024-01-28 22:01:16 字数 456 浏览 0 评论 0 收藏 0

概率论和统计学的研究对象是随机现象,主要是随机抽样形式的随机现象,比如随机数和随机分类变量。

概率论关注随机样本的来源和产生。我们通过适当的概率分布得到随机样本,并将它们用于:

模拟合成原始数据,并用于模型测试(就像我们在第30单元中所做的)

将原始数据分解成测试集和训练集(参见第48单元)

支持随机机器学习算法(比如第51单元中的随机决策森林)

另一方面,统计学则主要研究已收集的随机样本的属性。实验的原始数据几乎总是具有不确定性和不可预测性。我们将使用各种统计度量来描述因变量的观测值以及因变量和自变量之间的相互作用。

概率论和统计学都是具有丰富内涵和外延的数学领域。要学习它们的话,不能只阅读一本参考书中的一个章节。事实上,你可能已经对概率论和统计学有了一定的了解。本书的这部分内容只是对关键概念的简单回顾和总结。我们首先回顾一些概率理论,进而给出各种统计度量的数学定义,最后用Python的方式计算它们。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文