金融学中的假设检验:概念与实例 编辑
你的投资顾问向你提出一个月收入投资计划,保证每个月的可变回报。只有保证每月平均收入180美元,你才会投资它。你的顾问还告诉你,在过去的300个月里,这项计划的投资回报率平均为190美元,回报率为100%标准差75美元。你应该投资这个计划吗?假设检验 为这样的决策提供帮助。
关键要点
- 假设检验是一种数学工具,用于确认财务或商业主张或想法。
- 假设检验有助于投资者决定投资什么以及该工具是否可能提供令人满意的回报。
- 尽管存在不同的假设检验方法,但使用的是相同的四个步骤:定义假设、设置标准、计算统计数据和得出结论。
- 与大多数统计工具和模型一样,这种数学模型也有局限性,并且容易出现某些错误,因此投资者也有必要结合这种模型考虑其他模型
什么是假设检验?
假设或显著性检验是一种数学模型,用于使用样本集中测量的数据,检验给定总体集中有关参数的主张、想法或假设。对选定的样本进行计算,以收集有关整个人口特征的更具决定性的信息,从而能够系统地测试有关整个数据集的主张或想法。
这里有一个简单的例子:一位校长报告说,他们学校的学生在考试中平均得7分。为了检验这一“假设”,我们记录了学校全体学生(比如300人)中30名学生(样本)的分数,并计算样本的平均值。然后,我们可以比较(计算的)样本平均数和(报告的)总体平均数,并尝试确认假设。
再举一个例子,一个特定公司的年回报率共同基金 是8%。假设共同基金已经存在了20年。我们随机抽取共同基金五年(样本)的年回报率,并计算其平均值。然后我们比较(计算的)样本平均数和(声称的)总体平均数来验证假设。
本文假设读者熟悉正态分布表的概念、公式、p值和相关的统计学基础。
假设检验有不同的方法,但涉及相同的四个基本步骤:
第一步:定义假设
通常情况下,报告值(或索赔统计)作为假设陈述并假定为真。对于上述例子,假设为:
- 这所学校的学生考试平均得7分。
- 例B:共同基金的年回报率为8%。
此说明构成零假设(H)0)“并且是”;假设;事实上,在法庭上出示的证据证明被告有罪之前,陪审团审判中的被告被推定无罪。同样地,假设检验首先陈述并假设无效假设 ,然后这个过程确定这个假设是真是假。
需要注意的重要一点是,我们正在测试无效假设,因为它的有效性存在怀疑因素。与所述无效假设相反的任何信息都会在;替代假设(H)1). 对于上述例子,另一种假设是:
- 学生的平均分是不等于7。
- 共同基金的年回报率为不等于每年8%。
换言之,替代性假设是与无效假设的直接矛盾。
在审判中,陪审团假定被告无罪(无效假设)。检察官必须证明另一种情况(另一种假设)。同样地,研究者必须证明无效假设是真是假。如果检察官未能证明替代假设,陪审团必须让被告离开(基于无效假设的决定)。同样,如果研究人员未能证明另一种假设(或只是什么也不做),则假设无效假设为真。
决策标准必须基于数据集的某些参数。
第二步:设定标准
决策标准必须基于数据集的某些参数,这就是正态分布的联系所在。
根据标准统计假设 关于抽样分布,“对于任何样本大小n,如果抽取样本的总体X是正态分布,则X的抽样分布是正态分布。”因此所有其他可能的样本均值 可以选择的是正态分布。
例如,确定XYZ上上市的任何股票的平均日回报率股票市场 ,元旦前后大于2%。
H0 :无效假设:平均值=2%
H1 :替代假设:平均值>2%(这是我们要证明的)
取样本(比如500只股票中的50只),计算样本的平均值。
对于正态分布,95%的值躺在里面总体平均值的两个标准差。因此,样本数据集的正态分布和中心极限假设允许我们建立5%作为显著性水平。这是有道理的,因为在这种假设下,得到超出总体平均值两个标准差的异常值的概率不到5%(100-95)。根据数据集的性质,其他显著性水平可以取1%、5%或10%。对于金融计算(包括行为金融学),5%是公认的限额。如果我们发现任何计算超出了通常的两个标准差,那么我们就有一个很强的异常情况来拒绝零假设。
用图形表示如下:
在上面的例子中,如果样本的平均值远远大于2%(比如说3.5%),那么我们拒绝了无效假设。另一种假设(平均值>2%)被接受,这证实了股票的平均日回报率确实在2%以上。
然而,如果样本的平均值不太可能显著大于2%(并且保持在,比方说,2.2%左右),那么我们不能拒绝无效假设。挑战在于如何决定此类近距离案例。要从选定的样本和结果中得出结论,需要确定显著性水平,从而能够对无效假设作出结论。替代假设能够确定显著性水平或;“临界值”的概念来决定这种近距离案件。
根据教科书标准定义“临界值是一个临界值,它定义了一个界限,如果零假设成立,超过这个界限可以得到少于5%的样本均值。样本意味着获得超过临界值的结果将导致拒绝无效假设的决定。”; 在上面的例子中,如果我们将临界值定义为2.1%,并且计算的平均值达到2.2%,那么我们拒绝了无效假设。临界值确定了接受或拒绝的明确界限。
第三步:计算统计
这一步包括计算所需的数字,称为测试统计(如平均值,Z分数,P值 ,等)进行测试。(我们将在后面的部分中讨论这些问题。)
第四步:得出结论
根据计算出的值,确定零假设。如果得到样本均值的概率小于5%,那么结论是拒绝无效假设。否则,接受 并保留原假设。
错误类型
在基于样本的决策中,关于对整个人群的正确适用性,有四种可能的结果:
决定保留 | 拒绝的决定 | |
适用于所有人群 | 对的 | 不正确 (类型1错误-a) |
不适用于所有人群 | 不正确 (类型2错误-b) | 对的 |
“正确”的案例是那些对样本做出的决定真正适用于整个人群的案例。当一个人决定保留(或拒绝)基于样本计算的无效假设,但这个决定并不真正适用于整个人群时,就会出现错误的情况。这些病例构成1型(阿尔法)和类型2(贝塔 )错误,如上表所示。
选择正确的临界值可以消除1型α误差或将其限制在可接受的范围内。
α表示显著性水平上的误差,由研究人员确定。为保持概率计算的标准5%显著性或置信水平,将其保留在5%。
根据适用的决策基准和定义:
- “这个(α)标准通常设定为0.05(a=0.05),我们将α水平与p值进行比较。当I型错误小于5%(p<;0.05),我们决定拒绝无效假设;否则,我们保留无效假设。”
- 用于此概率的技术术语是P值. 它被定义为“假设零假设中的值为真,获得样本结果的概率。获得样本结果的p值与显著性水平进行比较;
- 第二类错误,或者beta错误,被定义为错误地保留无效假设的概率,而事实上它不适用于整个人群。
再举几个例子来说明这个和其他的计算。
例1
一个月收入投资计划存在,承诺每月可变回报。一个投资者只有在保证每月平均收入180美元的情况下才会投资它。投资者有一个300个月的回报样本,平均值为190美元,标准差为75美元。他们应该投资这个计划吗?
我们来解决这个问题。如果投资者确信他们期望的180美元的平均回报,他们将投资于该计划。
H0 :无效假设:平均值=180
H1 :替代假设:平均值>;180
方法1:临界值法
确定临界值XL对于样本平均值,其足够大以拒绝零假设–即,如果样本平均值>临界值X,则拒绝零假设L
P(识别I型α误差)=P(拒绝H0个;考虑到H0 为真),
当样本平均值超过临界限值时,就可以实现这一点。
=P(假设H0 为真)=α
图示如下:
取α=0.05(即5%显著性水平),Z0.05 =1.645(从Z表或正态分布表)
&=大于XL =180+1.645*(75/平方米(300))=187.12
由于样本均值(190)大于临界值(187.12),否定了零假设,结论是月平均收益确实大于180美元,投资者可以考虑投资该方案。
方法二:采用标准化检验统计
也可以使用标准值z。
检验统计量,Z=(样本平均数-总体平均数)/(标准偏差/sqrt(样本数)。
然后,拒绝区域变为:
Z=(190–180)/(75/平方米(300))=2.309
我们5%显著性水平的排斥区是Z>;Z0.05 =1.645。
由于Z=2.309大于1.645,可以用上面提到的类似结论来拒绝无效假设。
方法3:P值计算
我们的目标是确定P(样本平均值>;=190,当平均值=180)。
=P(Z>;=(190-180)/(75平方米(300))
=P(Z>;=2.309)=0.0084=0.84%
下表推断p值计算得出结论,有确凿证据表明平均月回报率高于180:
P值 | 推论 |
低于1% | 确凿的证据 支持替代假设 |
在1%到5%之间 | 有力的证据 支持替代假设 |
在5%到10%之间 | 证据不足 支持替代假设 |
大于10% | 缺乏证据 支持替代假设 |
例2
一个新的股票经纪人(XYZ)声称他们的经纪费低于你现在的股票经纪人(ABC)。一家独立研究公司提供的数据显示,所有ABC经纪人客户的平均和标准偏差分别为18美元和6美元。
以ABC的100位客户为样本,按照XYZ broker的新费率计算经纪费用。如果样本的平均值是18.75美元,而标准差是相同的(6美元),那么ABC和XYZ经纪人之间的平均经纪账单差异有什么推论吗?
H0 :无效假设:平均值=18
H1 :替代假设:平均值<;>18(这是我们要证明的。)
拒绝区域:Z<;=-Z2.5 和Z>;=Z2.5 (假设5%的显著性水平,两边各分2.5)。
Z=(样品平均值-平均值)/(标准偏差/sqrt(样品数量))
=(18.75–18)/(6/(sqrt(100))=1.25
计算的Z值介于以下两个限值之间:
-Z轴2.5;=-1.96和Z2.5; = 1.96.
这就得出结论,没有足够的证据来推断你现有经纪人和新经纪人的费率之间有任何差异。
或者,p值=p(Z<;-1.25)+p(Z>;1.25)
=2*0.1056=0.2112=21.12%,大于0.05或5%,得出相同的结论。
从图形上看,它由以下内容表示:
假设测试方法的批评要点:
- 基于假设的统计方法
- 容易出错,详细描述为alpha和beta错误
- p值的解释可能模棱两可,导致结果混乱
底线
假设检验允许一个数学模型在一定的置信水平下验证一个主张或想法。但是,与大多数统计工具和模型一样,它也受到一些限制。使用此模型进行财务决策时,应以批判的眼光考虑,并牢记所有依赖关系。其他方法,如;贝叶斯推理 对于类似的分析也值得探索。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论