描述性统计定义 编辑

什么是描述性统计?

描述的统计是概括给定数据集的简短描述性系数,可以是整个数据集的表示,也可以是总体的样本。描述性统计被分解为中心趋势和变异性(扩散)的度量。中心趋势的度量包括平均值、中位数和模式,而易变性包括标准差,方差,最小和最大变量,峰度,和偏斜 .

关键要点

  • 描述性统计总结或描述数据集的特征。
  • 描述性统计包括两类基本的度量:集中趋势度量和变异性度量(或扩散)。
  • 中心趋势度量描述了数据集的中心。
  • 可变性或扩散的度量描述了数据集内数据的分散性。
1:36

什么是描述性统计?

了解描述性统计

简言之,描述性统计有助于描述和理解特定数据集的特征,方法是对数据的样本和度量进行简短的总结。最受认可的描述性统计类型是中心测量:中心测量意思是,中值的,和模式 ,这在几乎所有的数学和统计学水平上都被使用。平均数或平均数的计算方法是将数据集中的所有数字相加,然后除以数据集中的数字数。例如,以下数据集的总和为20:(2、3、4、5、6)。平均值为4(20/5)。数据集的模式是最常出现的值,中位数是位于数据集中间的数字。它是在一个数据集中把高数字和低数字分开的数字。然而,还有一些不太常见的描述性统计类型仍然非常重要。

人们使用描述性统计方法,将难以理解的跨大型数据集的定量见解重新调整为小规模的描述。例如,学生的平均绩点(GPA)可以很好地理解描述性统计。GPA的概念是,它从各种各样的考试、班级和成绩中获取数据点,并将它们平均在一起,以提供对学生总体学习成绩的总体了解。学生的个人平均绩点反映了他们的平均学习成绩。

描述性统计方法

所有的描述性统计要么是集中趋势的度量,要么是集中趋势的度量易变性 ,也称为离散度度量。集中趋势的度量集中在数据集的平均值或中间值上,而可变性的度量集中在数据的分散性上。这两种方法使用图表和一般讨论来帮助人们理解所分析数据的含义。

中心趋势度量描述了数据集分布的中心位置。一个人分析分布中每个数据点的频率,并使用平均值、中位数或模式进行描述,该模式测量所分析数据集的最常见模式。

可变性度量或扩散度量有助于分析一组数据的分布是如何扩散的。例如,虽然中心趋势的度量可以给一个人一个数据集的平均值,但它并没有描述数据在数据集中是如何分布的。因此,虽然数据的平均值可能是100分之65,但仍然可以在1和100处都有数据点。可变性度量通过描述数据集的形状和分布来帮助传达这一点。射程,四分位 绝对偏差和方差都是可变性度量的例子。

考虑以下数据集:5、19、24、62、91、100。该数据集的范围是95,这是通过从最高值(100)中减去数据集中最低值(5)来计算的。

常见问题

为什么我们需要简单描述数据的统计数据?

描述性统计用于描述或总结样本或数据集的特征,如变量的平均值、标准差或频率。推断统计。这种类型的统计数据可以帮助我们理解数据样本元素的集合属性。这些措施可以让我们了解概率;分布 ,或数据的整体形状,可以在直方图或点图等图表上进行描述。了解变量的样本均值、方差和分布可以帮助我们了解周围的世界。

什么是均值和标准差?

这是两种常用的描述性统计。平均值是在某一数据段中观察到的平均水平,而标准差描述了方差,或者说在该变量中观察到的数据是如何分布在其平均值周围的。

描述性统计可以用来推断或预测吗?

不。虽然这些描述有助于理解数据的属性,但推断统计技术(统计学的一个独立分支)需要理解变量在数据集中如何相互作用。



如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

词条统计

浏览:62 次

字数:4698

最后编辑:7年前

编辑次数:0 次

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文