平方和定义 编辑
平方和是多少?
平方和是回归分析中用来确定数据点离散度的一种统计技术。在一个回归分析,目标是确定数据序列与函数的拟合程度,这可能有助于解释数据序列是如何生成的。平方和被用作一种数学方法来寻找最适合 (变化最小)与数据不同。
平方和的公式是
对于集合;X&的;n 项目:平方和=i=0∑n(Xi−X)2哪里:Xi=公司;ith&集合中的项目X=集合中所有项目的平均值(Xi−X)=每个项目与平均值的偏差
平方和也称为变差。
平方和告诉你什么?
平方和是偏离平均值的度量。在统计学中,平均数是一组数字的平均数,是最常用的中心趋势测量 . 算术平均值的计算方法很简单,就是将数据集中的值相加,然后除以值的个数。
假设微软(Microsoft)过去五天的收盘价分别为74.01、74.77、73.94、73.61和73.40美元。总价之和为369.73美元,因此教科书的平均价格为369.73美元/ 5 = $73.95.
但是知道测量集的平均值并不总是足够的。有时,了解一组测量值中有多少变化是有帮助的。单个值与平均值的距离有多远,可以让我们了解观察值或值与平均值的拟合程度回归模型 那是创造出来的。
例如,如果一位分析师想知道MSFT的股价是否与苹果(Apple)的股价同步变动,他可以列出这两只股票在一定时期内(比如1年、2年或10年)的一组观察结果,并创建一个线性模型 每次观察或测量都被记录下来。如果这两个变量之间的关系(即AAPL的价格和MSFT的价格)不是一条直线,那么需要仔细检查数据集中的变化。
从统计学的角度来说,如果线性模型中的线没有通过所有的价值测量,那么股价中观察到的一些变化是无法解释的。平方和用于计算线性关系存在于两个变量之间,任何无法解释的变异性都被称为残差平方和 .
平方和是变化平方的和,其中变化定义为每个值和平均值之间的差值。为了确定平方和,将每个数据点和最佳拟合线之间的距离平方,然后求和。最佳拟合线将使该值最小化。
如何计算平方和
现在你可以明白为什么测量被称为方差平方和,或者简称为平方和。使用上面的MSFT示例,平方和可以计算为:
- SS=(74.01-73.95)2+ (74.77 - 73.95)2+ (73.94 - 73.95)2+ (73.61 - 73.95)2+ (73.40 - 73.95)2
- SS=(0.06)2+ (0.82)2+ (-0.01)2+ (-0.34)2+ (-0.55)2
- SS=1.0942
只加上偏差之和而不进行平方运算将得到一个等于或接近零的数字,因为负偏差几乎可以完全抵消正偏差。为了得到一个更真实的数字,偏差之和必须是平方。平方和总是一个正数,因为任何数字的平方,无论是正的还是负的,总是正的。
如何使用平方和的示例
基于MSFT计算的结果,较高的平方和表明大多数值远离平均值,因此,数据中存在较大的可变性。低平方和是指观测数据集的低可变性。
在上面的例子中,1.0942表明MSFT的股价在过去五天的波动性非常低,投资者希望投资于价格稳定和稳定的股票低波动性 可以选择MSFT。
关键要点
- 平方和测量数据点偏离平均值的偏差。
- 较高的平方和结果表明数据集中存在较大程度的变化,而较低的结果表明数据与平均值相差不大。
使用平方和的局限性
做出购买什么股票的投资决策需要比这里列出的更多的观察。分析师可能需要处理多年的数据,才能更确定地知道资产的可变性有多高或多低。当更多的数据点被添加到集合中时,平方和会变得更大,因为值会更分散。
最广泛使用的变化测量是标准差和方差 . 但是,要计算这两个度量中的任何一个,必须首先计算平方和。方差是平方和的平均值(即平方和除以观察次数)。标准差是方差的平方根。
有两种使用平方和的回归分析方法:线性回归法最小二乘法 非线性最小二乘法。最小二乘法是指回归函数使实际数据点的方差平方和最小化的事实。这样,就有可能画出一个函数,在统计上为数据提供最佳拟合。请注意,回归函数可以是线性(直线)或非线性(曲线)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论