样本定义 编辑

什么是样品?

一个样本指的是一个较大组的一个较小的、可管理的版本。它是一个子集,包含一个较大的人口 . 当总体规模太大,无法包含所有可能的成员或观察值时,样本用于统计检验。一个样本应该代表整个人口,而不是反映对某一特定属性的任何偏见。

关键要点

  • 一个样本是指一个较大群体或一个较大群体的子集的一个较小的、可管理的版本。
  • 使用样本可以让研究人员轻松及时地进行研究。
  • 为了获得一个无偏的样本,选择必须是随机的,这样每个人都有一个平等的和可能的机会被添加到样本组。
  • 在简单随机抽样中,人口中的每一个实体都是相同的,而分层随机抽样将整个人口分成更小的群体;

了解示例

一个样本是从一个群体中获得的无偏数量的观察结果。在基本术语中,人口是任何给定对象的个体、动物、项目、观察、数据等的总数。所以这个样本,换句话说,是整个群体的一部分,一部分,或者一小部分,并且作为群体的一个子集。样本用于进行研究的各种环境中。科学家、市场营销人员、政府机构、经济学家和研究团体都使用样本进行研究和测量。

利用整个人口进行研究是一个挑战,这就是为什么要使用样本。研究人员在接触整个人群时可能会遇到困难。由于某些研究的性质,研究人员可能很难及时得到他们需要的结果。这就是为什么进行研究的人使用样本。使用代表整个人口的少数人仍然可以产生有效的结果,同时减少时间和资源。

研究人员使用的样本应该与人群非常相似。样本中的所有参与者应具有相同的特征和品质。因此,如果这项研究是针对男性大学新生的,那么样本应该是一小部分符合这一描述的男性。同样,如果一个研究小组对50岁以上的单身女性的睡眠模式进行研究,那么样本中应该只包括这一年龄段的女性人口统计学 .

以一组学术研究人员为例,他们想知道有多少学生在过去一段时间里学习不到40小时CFA考试 但还是过去了。由于全球每年有超过20万人参加考试,接触每一位考试参与者可能会非常乏味和耗时。

事实上,当收集和分析人口数据时,几年就过去了,因为新的人口将会出现,这使得分析毫无价值。研究人员可以做的是人口样本 从这个样本中获取数据。

为了得到一个无偏的样本,选择必须是随机的,这样群体中的每个人都有平等的机会加入这个群体。

为了获得一个无偏的样本,选择必须是随机的,这样每个人都有一个平等的和可能的机会被添加到样本组。这类似于抽奖,是抽奖的基础简单随机抽样 .

采样类型

简单随机抽样

简单的随机抽样是理想的,如果每个实体的人口是相同的。如果研究人员不关心他们的样本对象是全部男性还是全部女性,或者是某种形式的两性组合,那么简单的随机抽样可能是一种很好的选择方法。

假设2016年有20万考生参加了CFA考试,其中40%是女性,60%是男性。因此,从人群中随机抽取的样本应该有400名女性和600名男性,总共有1000名考生。

但是对于那些在学习不到40小时后通过测试的男女比例很重要的案例呢?这里,一个分层随机抽样 最好是简单的随机抽样。

分层随机抽样

这种抽样,也被称为比例随机抽样或配额随机抽样,将整个人口分成更小的群体。这些被称为地层。这个阶层的人有相似的特征。

如果年龄是一个重要的因素,研究人员想包括在他们的数据?使用分层随机抽样技术,他们可以为每个年龄组创建层或层。每个阶层的选择必须是随机的,这样括号里的每个人都有可能被纳入样本。例如,两个参与者,亚历克斯和大卫,分别是22岁和24岁。样本选择不能基于某种优先机制来选择一个。他们都应该有平等的机会从他们的年龄组中被选中。地层可能看起来像这样:

地层(年龄)人口数量样本中包含的编号
20-2430,000150
25-2970,000350
30-3440,000200
35-3930,000150
40-4420,000100
&大于4410,00050
总计200,0001,000

从表中可以看出,人口被划分为不同的年龄组。例如,2016年,30 000名年龄在20至24岁之间的人参加了CFA考试。使用相同的比例,样本组将有(30000÷;200000)x 1000=150名属于该组的考生。在样本的150名随机考试参与者中,可能包括Alex或David或两者,或两者都不包括。

在决定样本大小时,还有更多的地层可供汇编。一些研究人员在决定如何创建样本时,可能会填写考生的工作职能、国家、婚姻状况等。

样品示例

截至2017年,世界人口为75亿,其中女性占49.6%,男性占50.4%。任何一个国家的人口总数也可以是一个人口规模。一个城市的学生总数可以作为一个人口,一个城市的狗总数也是一个人口规模。为了研究目的,可以从这些人群中采集样本。

以我们的CFA考试为例,研究人员可以从总人数为200000的考生中抽取1000名CFA参与者的样本,并对这一数字进行必要的数据分析。这个样本的平均值将被用来估计通过CFA考试的考生的平均水平,即使他们只学习了不到40小时。

所取的样本组不应偏颇。这个方法 如果1000名CFA考试参与者的样本平均数是50,那么200000名考生的总体平均数也应该是50左右。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

词条统计

浏览:87 次

字数:6758

最后编辑:7年前

编辑次数:0 次

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文