剩余标准差定义 编辑
什么是剩余标准差?
残差标准差是一个统计术语,用来描述标准差观察值与预测值的比较,如图中的点所示回归分析 .
回归分析是一种常用的方法统计 展示两个不同变量之间的关系,并描述如何从一个变量的行为预测另一个变量的行为。
剩余标准偏差也称为拟合线或曲线周围点的标准偏差标准误差 估计数。
关键要点
- 残差标准差是残差值的标准差,或一组观测值和预测值之间的差值。
- 残差的标准差计算数据点在回归线周围分布的程度。
- 结果被用来衡量回归线的可预测性的误差。
- 与样本标准差相比,残差标准差越小,模型的预测性或实用性就越强。
理解剩余标准差
剩余标准差是拟合优度 可用于分析一组数据点与实际模型的拟合程度的度量。例如,在业务环境中,在对多个成本数据点进行一段时间的回归分析之后,剩余标准差可以向业务所有者提供有关实际成本和预计成本之间差异的信息,以及预计成本与历史成本数据平均值之间的差异。
剩余标准差公式
残余=(Y−Yest)Sres=n−2∑(Y−Yest)2哪里:Sres=剩余标准差Y=观察值Yest=估计值或预计值n=人口中的数据点
如何计算残差标准差
为了计算剩余标准差,必须首先计算拟合线周围形成的预测值和实际值之间的差值。这种差异被称为残差值,或者简单地说,残差或已知数据点与模型预测的数据点之间的距离。
为了计算残差标准差,将残差代入残差标准差方程中求解。
剩余标准差示例
从计算残值开始。例如,假设您有一组四个未命名实验的观测值,下表显示了给定x值的观测值和记录的y值:
x | y |
1 | 1 |
2 | 4 |
3 | 6 |
4 | 7 |
如果由模型中的数据预测的直线方程或斜率为y美国东部时间=1x+2,其中y美国东部时间 =预测y值,可以找到每个观测值的残差。
残差等于(y-y)美国东部时间),因此对于第一组,实际y值为1,预测y值为1美国东部时间方程给出的值是y美国东部时间 = 1(1) + 2 = 3. 因此,残值为1–3=-2,为负残值。
对于第二组x和y数据点,当x为2,y为4时的预测y值可计算为1(2)+2=4。
在这种情况下,实际值和预测值是相同的,因此残值将为零。您将使用相同的过程来获得剩余两个数据集中y的预测值。
使用表格或图表计算所有点的残差后,请使用残差标准差公式。
展开上表,计算剩余标准偏差:
x | y | y美国东部时间 | 残差(y-y美国东部时间) | 每个残差平方的和,或∑(y-y美国东部时间 )2个; |
1 | 1 | 3 | -2 | 4 |
2 | 4 | 4 | 0 | 0 |
3 | 6 | 5 | 1 | 1 |
4 | 7 | 6 | 1 | 1 |
请注意残差平方和 =6,表示残差标准差方程的分子。
对于剩余标准偏差方程的底部或分母,n=数据点的数量,在本例中为4。计算公式的分母为:
- (残差数-2)=(4-2)=2
最后,计算结果的平方根:
- 剩余标准差:;√(6/2) = √3 ≈ 1.732
典型残差的大小可以让你大致感觉到你的估计值有多接近。残差标准差越小,估计值越接近实际数据。实际上,剩余标准差与样品 标准差,模型越具有预测性或实用性。
当回归 进行了方差分析(ANOVA)。在确定定量限(LoQ)时,允许使用残留标准偏差代替标准偏差。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论