四分位数定义 编辑
什么是四分位数?
四分位数是统计学 描述根据数据值将观察值划分为四个定义区间的术语,以及它们与整个观察值集的比较方式;
理解四分位数
要理解四分位数,必须理解;中值的&作为;中心趋势测量 . 统计学中的中值是一组数字的中间值。在这个点上,正好有一半的数据位于中心值的下方和上方。
所以,给定一组13个数字,中位数就是第七个数字。此值前面的六个数字是数据中的最低数字,中间值后面的六个数字是给定数据集中的最高数字。因为中位数不受分布中的极值或异常值的影响,所以它有时比;意思是 .
中位数是一个稳健的位置估计器,但它并没有说明其值的两边的数据是如何传播或分散的。这就是四分位数的作用。四分位数通过将分布分为四组来测量平均值上下的值的分布。
关键要点
- 四分位数通过将分布分为四组来测量平均值上下的值的分布。
- 四分位数将数据分为三个点:下四分位数、中位数和上四分位数,形成四组数据集。
- 四分位数用于计算四分位数之间的范围,这是中位数周围可变性的度量。
四分位数的工作原理
就像中位数将数据分成一半,使50%的测量值低于中位数,50%的测量值高于中位数一样,四分位数将数据分成四分之一,使25%的测量值小于下四分位数,50%的测量值小于平均值,75%的测量值小于上四分位数。
四分位数将数据分为三个点:下四分位数、中位数和上四分位数,形成四组数据集。下四分位数或第一四分位数表示为Q1,是介于数据集最小值和中间值之间的中间数。第二个四分位数Q2也是中位数。上四分位数或第三个四分位数,表示为Q3,是分布中位数和最高值之间的中心点。
现在,我们可以画出由四分位数组成的四组。第一组值包含到Q1为止的最小值;第二组包括到中间值的Q1;第三组是到Q3的中间值;第四类包括到整个集合中最高数据点的Q3。
每个四分位数包含总观察值的25%。一般来说,数据是从最小到最大排列的:
- 第一个四分位数:数字中最低的25%
- 第二个四分位数:介于25.1%和50%之间(直到中位数)
- 第三个四分位数:51%到75%(高于中位数)
- 第四个四分位数:数字中最高的25%
四分位数示例
假设一个由19名学生组成的班级的数学分数按升序分布为:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
首先,记下中间值Q2,在本例中是10th 值:75。
Q1是最小分数和中位数之间的中心点。在这种情况下,Q1落在第一和第五个分数之间:68。[请注意,在计算奇数组值的Q1或Q3时,也可以包括中间值。如果我们把中间点两边的中间值都算进去,那么Q1就是第一个和第十个之间的中间值th 得分,即第五和第六个得分的平均值-(第五+第六)/2=(68+69)/2=68.5]。
Q3是Q2和最高分数84之间的中间值。[或者如果包括中间值,Q3=(82+84)/2=83]。
现在我们有了四分位数,让我们来解释它们的数字。68分(Q1)代表第一个四分位数,是25分位数th 百分位数。68是可用数据中设置的分数下半部分的中位数,即59到75之间的分数中位数。
Q1告诉我们,25%的分数低于68分,75%的班级分数高于68分。Q2(中位数)是50th 百分位数和显示50%的分数低于75,50%的分数高于75。最后,第三季度,75th 百分位数显示25%的分数大于84分,75%的分数小于84分。
特别注意事项
如果Q1的数据点离中值的距离比Q3离中值的距离远,那么我们可以说数据集较小值之间的离散度大于较大值之间的离散度。如果Q3与Q2的距离远于Q1与中值的距离,则同样的逻辑也适用。
或者,如果有偶数个数据点,中间值将是中间两个数字的平均值。在我们上面的例子中,如果我们有20名学生而不是19名学生,他们的分数中位数将是;算术平均 的th和11th 号码。
四分位数用于计算四分位数之间的范围,这是中位数周围可变性的度量。四分位间距简单地计算为第一个四分位和第三个四分位之间的差值:Q3–Q1。实际上,正是数据中间一半的范围显示了数据的分布情况。
对于大型数据集,microsoftexcel有一个四分位数函数来计算四分位数。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论