1.集中趋势度量

发布于 2024-01-28 21:41:25 字数 1415 浏览 0 评论 0 收藏 0

（1）均值

均值是所有数据的平均值。

如果求n个原始观察数据的平均数，计算公式为：

有时，为了反映在均值中不同成分所占的不同重要程度，为数据集中的每一个x_i赋予w_i，这就得到了加权均值的计算公式：

类似地，频率分布表（见表3-4）的平均数可以使用下式计算：

式中，x₁，x₂，…，x_k分别为k个组段的组中值；f₁，f₂，…，f_k分别为k个组段的频率。这里的fi起了权重的作用。

作为一个统计量，均值的主要问题是对极端值很敏感。如果数据中存在极端值或者数据是偏态分布的，那么均值就不能很好地度量数据的集中趋势。为了消除少数极端值的影响，可以使用截断均值或者中位数来度量数据的集中趋势。截断均值是去掉高、低极端值之后的平均数。

（2）中位数

中位数是将一组观察值按从小到大的顺序排列，位于中间的那个数。即在全部数据中，小于和大于中位数的数据个数相等。

将某一数据集x：{x₁，x₂，…，x_n}按从小到大排序：{x_（1），x_（2），…，x_（n）}。

当n为奇数时

当n为偶数时

（3）众数

众数是指数据集中出现最频繁的值。众数并不经常用来度量定性变量的中心位置，更适用于定性变量。众数不具有唯一性。当然，众数一般用于离散型变量而非连续型变量。

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据