返回介绍

3.3 概率分布

发布于 2024-01-20 12:27:18 字数 3131 浏览 0 评论 0 收藏 0

概率分布(probability distribution)用来描述随机变量或一簇随机变量在每一个可能取到的状态的可能性大小。我们描述概率分布的方式取决于随机变量是离散的还是连续的。

3.3.1 离散型变量和概率质量函数

离散型变量的概率分布可以用概率质量函数(probability mass function,PMF)(1)来描述。我们通常用大写字母P来表示概率质量函数。通常每一个随机变量都会有一个不同的概率质量函数,并且读者必须根据随机变量来推断所使用的PMF,而不是根据函数的名称来推断,例如,P(x)通常和P(y)不一样。

概率质量函数将随机变量能够取得的每个状态映射到随机变量取得该状态的概率。x=x的概率用P(x)来表示,概率为1表示x=x是确定的,概率为0表示x=x是不可能发生的。有时为了使得PMF的使用不相互混淆,我们会明确写出随机变量的名称:P(x=x)。有时我们会先定义一个随机变量,然后用∼符号来说明它遵循的分布:x∼P(x)。

概率质量函数可以同时作用于多个随机变量。这种多个变量的概率分布被称为联合概率分布(joint probability distribution)。P(x=x,y=y)表示x=x和y=y同时发生的概率。我们也可以简写为P(x,y)。

如果一个函数P是随机变量x的PMF,必须满足下面这几个条件:

P的定义域必须是x所有可能状态的集合。

。不可能发生的事件概率为0,并且不存在比这概率更低的状态。类似地,能够确保一定发生的事件概率为1,而且不存在比这概率更高的状态。

。我们把这条性质称之为归一化的(normalized)。如果没有这条性质,当我们计算很多事件其中之一发生的概率时,可能会得到大于1的概率。

例如,考虑一个离散型随机变量x有k个不同的状态。我们可以假设x是均匀分布(uniform distribution)的(也就是将它的每个状态视为等可能的),通过将它的PMF设为

对于所有的i都成立。我们可以看出这满足上述成为概率质量函数的条件。因为k是一个正整数,所以是正的。我们也可以看出

因此分布也满足归一化条件。

3.3.2 连续型变量和概率密度函数

当研究的对象是连续型随机变量时,我们用概率密度函数(probability density function,PDF)而不是概率质量函数来描述它的概率分布。如果一个函数p是概率密度函数,必须满足下面这几个条件:

p的定义域必须是x所有可能状态的集合。

。注意,我们并不要求

概率密度函数P(x)并没有直接对特定的状态给出概率,相对的,它给出了落在面积为δx的无限小的区域内的概率为P(x)δx。

我们可以对概率密度函数求积分来获得点集的真实概率质量。特别是,x落在集合中的概率可以通过P(x)对这个集合求积分来得到。在单变量的例子中,x落在区间[a,b]的概率是

为了给出一个连续型随机变量的PDF的例子,我们可以考虑实数区间上的均匀分布。我们可以使用函数u(x;a,b),其中a和b是区间的端点且满足b>a。符号“;”表示“以什么为参数”;我们把x作为函数的自变量,a和b作为定义函数的参数。为了确保区间外没有概率,我们对所有的。在[a,b]内,有。可以看出,任何一点都非负。另外,它的积分为1。我们通常用x∼U(a,b)表示x在[a,b]上是均匀分布的。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文