卡方(χ2)统计定义 编辑
什么是卡方统计?
卡方检验(χ2)统计是一种测试,用来衡量模型与实际观测数据的比较。用于计算卡方误差的数据统计的一定是随机的,原始的,互斥的 从自变量中提取,从足够大的样本中提取。例如,投掷一枚公平硬币的结果符合这些标准。
卡方检验常用于临床假设检验. 在给定样本大小和关系中变量数量的情况下,卡方统计量比较预期结果和实际结果之间的任何差异。对于这些测试,自由度用于确定;无效假设 可以根据实验中变量和样本的总数拒绝。与任何统计一样,样本量越大,结果越可靠。
关键要点
- 卡方检验(χ2)统计是一组事件或变量的结果的观察频率和预期频率之间的差异的度量。
- χ2取决于实际值与观测值之差的大小、自由度和样本大小。
- χ2可用于测试两个变量是否相互关联或独立,或测试频率的观测分布和理论分布之间的拟合优度。
卡方的公式是
χc2=∑Ei(Oi−Ei)2哪里:c=自由度O=观察值
卡方统计告诉你什么?
卡方检验主要有两种:独立性检验,它提出了一个关系问题,例如,“学生性别和课程选择之间有关系吗?”?&以及;拟合优度检验 ,它会问“我手中的硬币与理论上公平的硬币匹配程度如何?”?&引用;
独立性
在考虑学生性别和课程选择时χ2可以使用独立性测试。为了进行这项测试,研究人员将收集两个变量(性别和所选课程)的数据,然后使用上面给出的公式和一个简单的公式比较男女学生在所提供的课程中选择的频率χ2 统计表。
如果性别和课程选择之间没有关系(也就是说,如果他们是独立的),那么男女学生选择每门课程的实际频率应该大致相等,或者相反,任何选定课程中男女学生的比例应该大致相等样本中男女学生的比例。Aχ2 独立性测试可以告诉我们,随机机会能够解释数据中实际频率和这些理论预期之间的任何观察到的差异的可能性有多大。
拟合优度
χ2 提供了一种方法来测试数据样本与该样本要表示的较大总体的(已知或假定)特征的匹配程度。如果样本数据不符合我们感兴趣的总体的预期属性,那么我们就不想用这个样本来得出关于更大总体的结论。
举个例子,想象一枚正面或反面有50/50几率落地的假想硬币和一枚你掷100次的真硬币。如果这枚真正的硬币有一个“是公平的”,那么它在任何一边着陆的概率都是相等的,掷硬币100次的预期结果是正面上升50次,反面上升50次。在这种情况下,χ2 你可以告诉我们,100枚硬币的实际结果与一枚普通硬币能给出50/50结果的理论模型相比有多好。实际的掷硬币可能是50/50,或60/40,甚至90/10。100次抛硬币的实际结果离50/50越远,这组硬币与50/50的理论预期的吻合就越差,我们就越有可能得出这样的结论:这枚硬币实际上不是一枚公平的硬币。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论