了解简单随机与分层随机样本 编辑
在统计分析中;人口&是存在的观察或数据的总集。然而,测量人口中的每个个体或数据点往往是不可行的。相反,研究人员依赖于样本。A样品 是一组来自人群的观察结果。抽样方法是从总体中抽取样本的过程。
简单随机样本 分层随机抽样和分层随机抽样都是获取样本的常用方法。一个简单的随机样本用于表示整个数据总体而且是随机的从群体中选择个体而不考虑任何其他因素。
另一方面,分层随机抽样首先根据共同特征将人群分成更小的群体或阶层。因此,分层抽样策略将确保每个分组的成员都包含在数据分析中。
关键要点
- 简单随机和分层随机样本是统计测量工具。
- 一个简单的随机样本需要整个人口中的一小部分基本数据来表示整个数据集。
- 人口被分成具有相似特征的不同群体,从中抽取分层随机样本。
简单随机抽样
简单随机抽样是一种有效的方法统计工具 用于描述从数据总体中获取的非常基本的样本。这个样本相当于整个人口。
当关于数据总体的可用信息非常少,当数据总体的差异太大而无法划分为不同的子集,或者当数据总体中只有一个明显的特征时,通常使用简单随机样本。
例如,一家糖果公司可能希望研究其客户的购买习惯,以确定其产品线的未来。如果有10000个客户,它可以使用从这些客户中选择100个作为随机样本。然后,它可以将从这100个客户那里得到的信息应用到其他客户群中。
统计学家将设计一个详尽的数据总体列表,然后在这个大群体中随机选取一个样本。在这个样本中,每个人口成员都有平等的机会被选为样本的一部分。可通过两种方式选择:
- 通过手工抽奖,每个人都有一个号码。然后有人随机抽取数字,将其包含在样本中。这是最好的使用时,看看一个小组。
- 计算机生成的采样。这种方法最适用于较大的数据集,使用计算机来选择样本,而不是人类。
利用简单的随机抽样,研究人员可以对特定人群进行概括,并排除任何偏见。这有助于决定如何做出未来的决定。因此,上述示例中的糖果公司可以使用此工具根据100位客户的当前口味开发一种新的糖果口味进行生产。但请记住,这些都是泛化的,因此存在错误的空间。毕竟,这是一个简单的例子。这100位顾客可能无法准确反映整个人群的口味。
分层随机抽样
与简单的随机样本不同,分层随机样本用于很容易分成不同子组或子集的总体。这些组是基于一定的标准,然后根据组的大小和人口的比例从每个组中随机选择元素。
这种抽样方法意味着将从每个不同的群体中进行选择,其规模取决于其在整个人口中的比例。但研究人员必须确保地层不重叠。人口中的每个点必须只属于一个阶层,所以每个点都是互斥的 . 重叠的地层会增加包含某些数据的可能性,从而使样本倾斜。
糖果公司可决定采用随机分层抽样法,将100名顾客分成不同的年龄组,以帮助确定其生产的未来。
投资组合经理可以使用分层随机抽样,通过复制债券指数等指数来创建投资组合。
分层抽样 与简单的随机抽样相比,提供了一些优点和缺点。因为它使用特定的特征,它可以提供一个更准确的代表性的人口基于什么是用来划分为不同的子集。这通常需要较小的样本量,这可以节省资源和时间。此外,研究人员还可以从每一层中选取足够的样本点,对每一层进行单独的分析。
但是分层抽样比随机抽样需要做更多的工作。研究人员必须单独跟踪和验证每一层的数据,与随机抽样相比,这可能需要更多的时间。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论