描述性统计定义 编辑
什么是描述性统计?
描述的统计是概括给定数据集的简短描述性系数,可以是整个数据集的表示,也可以是总体的样本。描述性统计被分解为中心趋势和变异性(扩散)的度量。中心趋势的度量包括平均值、中位数和模式,而易变性包括标准差,方差,最小和最大变量,峰度,和偏斜 .
关键要点
- 描述性统计总结或描述数据集的特征。
- 描述性统计包括两类基本的度量:集中趋势度量和变异性度量(或扩散)。
- 中心趋势度量描述了数据集的中心。
- 可变性或扩散的度量描述了数据集内数据的分散性。
什么是描述性统计?
了解描述性统计
简言之,描述性统计有助于描述和理解特定数据集的特征,方法是对数据的样本和度量进行简短的总结。最受认可的描述性统计类型是中心测量:中心测量意思是,中值的,和模式 ,这在几乎所有的数学和统计学水平上都被使用。平均数或平均数的计算方法是将数据集中的所有数字相加,然后除以数据集中的数字数。例如,以下数据集的总和为20:(2、3、4、5、6)。平均值为4(20/5)。数据集的模式是最常出现的值,中位数是位于数据集中间的数字。它是在一个数据集中把高数字和低数字分开的数字。然而,还有一些不太常见的描述性统计类型仍然非常重要。
人们使用描述性统计方法,将难以理解的跨大型数据集的定量见解重新调整为小规模的描述。例如,学生的平均绩点(GPA)可以很好地理解描述性统计。GPA的概念是,它从各种各样的考试、班级和成绩中获取数据点,并将它们平均在一起,以提供对学生总体学习成绩的总体了解。学生的个人平均绩点反映了他们的平均学习成绩。
描述性统计方法
所有的描述性统计要么是集中趋势的度量,要么是集中趋势的度量易变性 ,也称为离散度度量。集中趋势的度量集中在数据集的平均值或中间值上,而可变性的度量集中在数据的分散性上。这两种方法使用图表和一般讨论来帮助人们理解所分析数据的含义。
中心趋势度量描述了数据集分布的中心位置。一个人分析分布中每个数据点的频率,并使用平均值、中位数或模式进行描述,该模式测量所分析数据集的最常见模式。
可变性度量或扩散度量有助于分析一组数据的分布是如何扩散的。例如,虽然中心趋势的度量可以给一个人一个数据集的平均值,但它并没有描述数据在数据集中是如何分布的。因此,虽然数据的平均值可能是100分之65,但仍然可以在1和100处都有数据点。可变性度量通过描述数据集的形状和分布来帮助传达这一点。射程,四分位 绝对偏差和方差都是可变性度量的例子。
考虑以下数据集:5、19、24、62、91、100。该数据集的范围是95,这是通过从最高值(100)中减去数据集中最低值(5)来计算的。
常见问题
为什么我们需要简单描述数据的统计数据?
描述性统计用于描述或总结样本或数据集的特征,如变量的平均值、标准差或频率。推断统计。这种类型的统计数据可以帮助我们理解数据样本元素的集合属性。这些措施可以让我们了解概率;分布 ,或数据的整体形状,可以在直方图或点图等图表上进行描述。了解变量的样本均值、方差和分布可以帮助我们了解周围的世界。
什么是均值和标准差?
这是两种常用的描述性统计。平均值是在某一数据段中观察到的平均水平,而标准差描述了方差,或者说在该变量中观察到的数据是如何分布在其平均值周围的。
描述性统计可以用来推断或预测吗?
不。虽然这些描述有助于理解数据的属性,但推断统计技术(统计学的一个独立分支)需要理解变量在数据集中如何相互作用。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论