抽样分布定义编辑

什么是抽样分布？

抽样分布是概率分布指从特定人群中抽取大量样本所得的统计数据。给定总体的抽样分布是一系列不同结果的频率分布，这些结果可能发生在一个给定总体的统计中人口 .

在；统计，一个总体是一个统计；样品已绘制。人口可以是指整个群体的人，物体，事件，医院访问，或测量。因此，一个群体可以说是由一个共同特征组合在一起的对象的集合观察。

抽样分布是通过从较大的人群中重复抽样得出的统计数据。
它描述了一系列可能的统计结果，例如某个变量的平均值或模式，因为它确实存在于一个总体中。
研究人员分析的大多数数据实际上是从样本中提取的，而不是从人群中提取的。

了解抽样分布

很多数据由院士、统计学家、研究人员、营销人员、分析师等绘制和使用的实际上是样本，而不是总体。样本是总体的一个子集。例如，一位医学研究人员想将1995年至2005年期间在北美出生的所有婴儿的平均体重与同一时期在南美出生的婴儿的平均体重进行比较，却无法在合理的时间内得出10年期间发生的100多万次分娩的整个人口的数据。相反，他只会用每个大陆100个婴儿的体重来做结论。使用200名婴儿的体重作为样本，计算出的平均体重是样本的平均值。

现在假设医学研究人员不是从每一大洲的100个新生儿体重中抽取一个样本，而是从普通人群中重复随机抽取样本，并计算每个样本组的样本平均数。因此，在北美，他收集了美国、加拿大和墨西哥记录的100个新生儿体重的数据如下：来自美国部分医院的4个100个样本，来自加拿大的5个70个样本，以及来自墨西哥的3个150个记录，共有1200个新生儿体重分为12组。他还收集了来自南美洲12个国家的100个出生体重的样本数据。

每个样本都有自己的样本均值，样本均值的分布称为样本分布。

为每个样本集计算的平均权重是平均值的抽样分布。不仅仅是平均数可以从样本中计算出来。其他统计数据例如标准差、方差、比例和范围可以从样本数据中计算出来。标准差和方差衡量抽样分布的可变性。

总体中的观察数、样本中的观察数以及用于绘制样本集的程序决定了样本分布的可变性。抽样分布的标准差称为标准误差 . 虽然抽样分布的平均数等于总体的平均数，但标准误差取决于总体的标准差、总体的大小和样本的大小。

了解每个样本集的平均值彼此之间以及总体平均值之间的分布情况，将表明样本平均值与总体平均值的接近程度。样本分布的标准误差随样本量的增加而减小。