抽样分布定义 编辑
什么是抽样分布?
抽样分布是概率分布指从特定人群中抽取大量样本所得的统计数据。给定总体的抽样分布是一系列不同结果的频率分布,这些结果可能发生在一个给定总体的统计中人口 .
在;统计,一个总体是一个统计;样品 已绘制。人口可以是指整个群体的人,物体,事件,医院访问,或测量。因此,一个群体可以说是由一个共同特征组合在一起的对象的集合观察。
- 抽样分布是通过从较大的人群中重复抽样得出的统计数据。
- 它描述了一系列可能的统计结果,例如某个变量的平均值或模式,因为它确实存在于一个总体中。
- 研究人员分析的大多数数据实际上是从样本中提取的,而不是从人群中提取的。
了解抽样分布
很多数据 由院士、统计学家、研究人员、营销人员、分析师等绘制和使用的实际上是样本,而不是总体。样本是总体的一个子集。例如,一位医学研究人员想将1995年至2005年期间在北美出生的所有婴儿的平均体重与同一时期在南美出生的婴儿的平均体重进行比较,却无法在合理的时间内得出10年期间发生的100多万次分娩的整个人口的数据。相反,他只会用每个大陆100个婴儿的体重来做结论。使用200名婴儿的体重作为样本,计算出的平均体重是样本的平均值。
现在假设医学研究人员不是从每一大洲的100个新生儿体重中抽取一个样本,而是从普通人群中重复随机抽取样本,并计算每个样本组的样本平均数。因此,在北美,他收集了美国、加拿大和墨西哥记录的100个新生儿体重的数据如下:来自美国部分医院的4个100个样本,来自加拿大的5个70个样本,以及来自墨西哥的3个150个记录,共有1200个新生儿体重分为12组。他还收集了来自南美洲12个国家的100个出生体重的样本数据。
每个样本都有自己的样本均值,样本均值的分布称为样本分布。
为每个样本集计算的平均权重是平均值的抽样分布。不仅仅是平均数可以从样本中计算出来。其他统计数据 例如标准差、方差、比例和范围可以从样本数据中计算出来。标准差和方差衡量抽样分布的可变性。
总体中的观察数、样本中的观察数以及用于绘制样本集的程序决定了样本分布的可变性。抽样分布的标准差称为标准误差 . 虽然抽样分布的平均数等于总体的平均数,但标准误差取决于总体的标准差、总体的大小和样本的大小。
了解每个样本集的平均值彼此之间以及总体平均值之间的分布情况,将表明样本平均值与总体平均值的接近程度。样本分布的标准误差随样本量的增加而减小。
特别注意事项
一个总体或一组数字样本将具有正态分布。但是,由于抽样分布包含多组观测值,因此不一定有钟形曲线 形状。
按照我们的例子,北美和南美婴儿的人口平均体重呈正态分布,因为有些婴儿体重不足(低于平均值)或超重(高于平均值),大多数婴儿介于两者之间(接近平均值)。如果北美新生儿的平均体重是7磅,那么在北美记录的12组样本观察中,每个样本的平均体重也将接近7磅。
但是,如果将在1200个样本组中计算的每个平均值绘制成图表,则结果形状可能会导致均匀分布,但很难确定实际形状将是什么。研究人员从超过一百万个体重数字的人群中抽取的样本越多,图表就会越开始形成正态分布。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论