样本定义 编辑
什么是样品?
一个样本指的是一个较大组的一个较小的、可管理的版本。它是一个子集,包含一个较大的人口 . 当总体规模太大,无法包含所有可能的成员或观察值时,样本用于统计检验。一个样本应该代表整个人口,而不是反映对某一特定属性的任何偏见。
关键要点
- 一个样本是指一个较大群体或一个较大群体的子集的一个较小的、可管理的版本。
- 使用样本可以让研究人员轻松及时地进行研究。
- 为了获得一个无偏的样本,选择必须是随机的,这样每个人都有一个平等的和可能的机会被添加到样本组。
- 在简单随机抽样中,人口中的每一个实体都是相同的,而分层随机抽样将整个人口分成更小的群体;
了解示例
一个样本是从一个群体中获得的无偏数量的观察结果。在基本术语中,人口是任何给定对象的个体、动物、项目、观察、数据等的总数。所以这个样本,换句话说,是整个群体的一部分,一部分,或者一小部分,并且作为群体的一个子集。样本用于进行研究的各种环境中。科学家、市场营销人员、政府机构、经济学家和研究团体都使用样本进行研究和测量。
利用整个人口进行研究是一个挑战,这就是为什么要使用样本。研究人员在接触整个人群时可能会遇到困难。由于某些研究的性质,研究人员可能很难及时得到他们需要的结果。这就是为什么进行研究的人使用样本。使用代表整个人口的少数人仍然可以产生有效的结果,同时减少时间和资源。
研究人员使用的样本应该与人群非常相似。样本中的所有参与者应具有相同的特征和品质。因此,如果这项研究是针对男性大学新生的,那么样本应该是一小部分符合这一描述的男性。同样,如果一个研究小组对50岁以上的单身女性的睡眠模式进行研究,那么样本中应该只包括这一年龄段的女性人口统计学 .
以一组学术研究人员为例,他们想知道有多少学生在过去一段时间里学习不到40小时CFA考试 但还是过去了。由于全球每年有超过20万人参加考试,接触每一位考试参与者可能会非常乏味和耗时。
事实上,当收集和分析人口数据时,几年就过去了,因为新的人口将会出现,这使得分析毫无价值。研究人员可以做的是人口样本 从这个样本中获取数据。
为了得到一个无偏的样本,选择必须是随机的,这样群体中的每个人都有平等的机会加入这个群体。
为了获得一个无偏的样本,选择必须是随机的,这样每个人都有一个平等的和可能的机会被添加到样本组。这类似于抽奖,是抽奖的基础简单随机抽样 .
采样类型
简单随机抽样
简单的随机抽样是理想的,如果每个实体的人口是相同的。如果研究人员不关心他们的样本对象是全部男性还是全部女性,或者是某种形式的两性组合,那么简单的随机抽样可能是一种很好的选择方法。
假设2016年有20万考生参加了CFA考试,其中40%是女性,60%是男性。因此,从人群中随机抽取的样本应该有400名女性和600名男性,总共有1000名考生。
但是对于那些在学习不到40小时后通过测试的男女比例很重要的案例呢?这里,一个分层随机抽样 最好是简单的随机抽样。
分层随机抽样
这种抽样,也被称为比例随机抽样或配额随机抽样,将整个人口分成更小的群体。这些被称为地层。这个阶层的人有相似的特征。
如果年龄是一个重要的因素,研究人员想包括在他们的数据?使用分层随机抽样技术,他们可以为每个年龄组创建层或层。每个阶层的选择必须是随机的,这样括号里的每个人都有可能被纳入样本。例如,两个参与者,亚历克斯和大卫,分别是22岁和24岁。样本选择不能基于某种优先机制来选择一个。他们都应该有平等的机会从他们的年龄组中被选中。地层可能看起来像这样:
地层(年龄) | 人口数量 | 样本中包含的编号 |
20-24 | 30,000 | 150 |
25-29 | 70,000 | 350 |
30-34 | 40,000 | 200 |
35-39 | 30,000 | 150 |
40-44 | 20,000 | 100 |
&大于44 | 10,000 | 50 |
总计 | 200,000 | 1,000 |
从表中可以看出,人口被划分为不同的年龄组。例如,2016年,30 000名年龄在20至24岁之间的人参加了CFA考试。使用相同的比例,样本组将有(30000÷;200000)x 1000=150名属于该组的考生。在样本的150名随机考试参与者中,可能包括Alex或David或两者,或两者都不包括。
在决定样本大小时,还有更多的地层可供汇编。一些研究人员在决定如何创建样本时,可能会填写考生的工作职能、国家、婚姻状况等。
样品示例
截至2017年,世界人口为75亿,其中女性占49.6%,男性占50.4%。任何一个国家的人口总数也可以是一个人口规模。一个城市的学生总数可以作为一个人口,一个城市的狗总数也是一个人口规模。为了研究目的,可以从这些人群中采集样本。
以我们的CFA考试为例,研究人员可以从总人数为200000的考生中抽取1000名CFA参与者的样本,并对这一数字进行必要的数据分析。这个样本的平均值将被用来估计通过CFA考试的考生的平均水平,即使他们只学习了不到40小时。
所取的样本组不应偏颇。这个方法 如果1000名CFA考试参与者的样本平均数是50,那么200000名考生的总体平均数也应该是50左右。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论