业务分析回归基础 编辑

如果您曾经想知道两个或多个数据段是如何相互关联的(例如国内生产总值受失业率和通货膨胀变化的影响),或者如果你的老板要求你根据变量之间的关系创建预测或分析预测,那么学习回归 分析很值得你花时间。

在本文中,您将学习简单线性回归的基础知识,有时称为“普通最小二乘法”或OLS回归-常用于预测和财务分析的工具。我们将从学习回归的核心原则开始,首先学习协方差和相关性,然后继续构建和解释回归输出。流行的商业软件,如微软Excel 你可以做所有的回归计算和输出,但它仍然是重要的学习基本机制。

关键要点

  • 例如,简单线性回归通常用于预测和财务分析,以判断GDP的变化如何影响销售。
  • microsoftexcel和其他软件可以做所有的计算,但是了解简单线性回归的原理是很好的。

变量

回归模型的核心是两个不同变量之间的关系,称为因变量和自变量。例如,假设你想预测你的公司的销售额,你已经得出结论,你的公司的销售额上升和下降取决于国内生产总值的变化。

你预测的销售额将是因变量,因为它们的价值取决于GDP的价值,而GDP将是自变量。然后需要确定这两个变量之间的关系强度,以便预测销售额。如果国内生产总值增加/减少1%,你的销售额会增加或减少多少?

协方差

 Cov(x,y)=(xnxu)(ynyu)Negin{aligned}&Cov(x,y)=sumfrac{(xu n-xu)(yu n-yu)}{n} end{aligned}Cov(x,y)=∑N(xn−xu)(yn−yu) 

计算两个变量之间关系的公式叫做协方差 . 此计算向您显示关系的方向。如果一个变量增加而另一个变量也趋于增加,协方差将为正。如果一个变量上升而另一个趋于下降,那么协方差将为负。

通过计算得到的实际数字可能很难解释,因为它不是标准化的。例如,5的协方差可以解释为正相关,但这种关系的强度只能说比4强,或者比6弱。

相关系数

 Correlation=ρxy=Covxysxsyegin{aligned}&Correlation=ho{xy}=frac{Cov{xy}}{su x su y} end{aligned}Correlation=ρxy=sxsyCovxy 

我们需要将协方差标准化,以便更好地解释和使用它进行预测,结果就是相关性计算。相关性计算只是将协方差除以标准差 两个变量中的一个。这将绑定值-1和+1之间的相关性。

一个+1的相关性可以解释为这两个变量之间完全正相关,而一个-1则意味着它们完全负相关。在我们前面的例子中,如果相关系数为+1,GDP增加1%,那么销售额将增加1%。如果相关系数为-1,则GDP增长1%将导致销售额下降1%,反之亦然。

回归方程

既然我们知道了两个变量之间的相对关系是如何计算的,我们就可以建立一个回归方程来预测或预测我们想要的变量。下面是简单线性回归的公式。y是我们试图预测的值,b是回归线的斜率,x是独立值,a代表y截距。回归方程简单地描述了因变量(y)和自变量(x)之间的关系。

 y=bx+aegin{aligned}&y=bx+a end{aligned}y=bx+a 

如果x(自变量)的值为零,则截距或“a”是y(因变量)的值,因此有时被简单地称为“常数”。因此,如果GDP没有变化,您的公司仍会进行一些销售。当GDP的变化为零时,这个值就是截距。请看下面的图表,看看回归方程的图示。在这个图中,只有五个数据点由图上的五个点表示。线性回归试图估计一条最适合数据的直线(a最佳拟合线 )这条线的方程就是回归方程。

Julie Bang图片©Abcexchange 2019

Excel中的回归

现在您已经了解了回归分析的一些背景知识,让我们使用Excel的回归工具 . 我们将以上一个例子为基础,根据GDP的变化来预测明年的销售额。下表列出了一些人工数据点,但这些数字在现实生活中很容易获得。

出售国内生产总值
20151001.00%
20162501.90%
20172752.40%
20182002.60%
20193002.90%

只要看一下表,你就会发现销售额和GDP之间正相关。两者都倾向于同时上升。使用Excel,只需单击工具下拉菜单,选择数据分析;从那里选择回归 弹出框很容易填写;输入Y范围是“销售”列,输入X范围是“GDP变化”列;选择要在电子表格中显示数据的输出范围,然后按“确定”。您应该看到与下表中给出的内容类似的内容:

&回归统计;&系数

多重R0.8292243拦截34.58409
 

R正方形

 

0.687613国内生产总值88.15552
调整

 

R正方形

 

0.583484 

-

 

-

标准误差51.021807- 

-

观察5 

-

 

-

解释

对于简单线性回归,您需要关注的主要输出是R平方,截距(常数)和GDP的β(b)系数。本例中的R平方数为68.7%。这显示了我们的模型对未来销售额的预测程度,表明模型中的解释变量预测了因变量中68.7%的变化。接下来,我们有一个34.58的截距,它告诉我们,如果GDP的变化被预测为零,我们的销量将是35台。最后,GDPβ或相关系数 88.15告诉我们,如果国内生产总值增长1%,销售额可能会增加约88个单位。

底线

那么,您将如何在业务中使用这个简单的模型呢?好吧,如果你的研究让你相信下一个GDP变化将是一个特定的百分比,你可以把这个百分比插入模型并生成一个销售预测。这可以帮助你为下一年制定更客观的计划和预算。

当然,这只是一个简单的回归可以构建的模型使用几个独立变量多元线性回归 但是多元线性回归更为复杂,有几个问题需要另一篇文章来讨论。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

词条统计

浏览:40 次

字数:9459

最后编辑:8年前

编辑次数:0 次

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文