拟合优度定义 编辑
拟合优度检验是一种统计假设检验,用以检验样本数据如何很好地拟合一个分布在一个总体上有一个正态分布 . 换言之,这个测试显示了你的样本数据是否代表了你期望在实际人群中找到的数据,或者它是否有偏差。拟合优度确定了观测值与正态分布情况下模型预期值之间的差异。
确定拟合优度有多种方法。在统计学中使用的一些最流行的方法包括卡方检验、Kolmogorov-Smirnov检验、Anderson-Darling检验和Shipiro-Wilk检验。
关键要点
- 拟合优度检验是统计检验,旨在确定一组观测值是否符合适用模型下的预期值。
- 拟合优度检验有多种类型,但最常见的是卡方检验。
- 卡方检验确定分类数据之间是否存在关系。
- 用于大样本的Kolmogorov-Smirnov检验确定样本是否来自特定的种群分布。
- 拟合优度测试可以显示样本数据是否符合正态分布总体的预期数据集。
了解拟合优度
拟合优度检验是常用于对观测值进行推断的统计方法。这些测试确定实际值与模型中预测值的关联程度,当用于决策时,拟合优度测试可以帮助预测未来的趋势和模式。
最常见的拟合优度检验是卡方检验,通常用于离散分布。卡方检验专门用于将数据放入类(bin)中,它需要足够的样本量来产生准确的结果。
拟合优度检验通常用于检验残差的正态性或确定两个样本是否来自相同的分布。
拟合优度检验的类型
卡方检验
这个卡方检验 ,也被称为卡方检验的独立性,是一种推断统计方法,测试的有效性,提出了一个关于人口的索赔基于随机样本。然而,它并没有表明这种关系的类型或强度。例如,它不能断定这种关系是积极的还是消极的。
为了符合卡方检验的独立性,变量必须是互斥的。
为了计算卡方拟合优度,有必要设置期望的α显著性水平(例如,如果您的置信水平为95%或.95,则α为.05),确定要测试的分类变量,并定义关于它们之间关系的假设陈述。这个无效假设断言变量之间不存在任何关系,而另一种假设假定存在某种关系。测量观测值的频率,然后与预期值和自由度 计算卡方误差。如果结果低于alpha,则无效假设无效,表明变量之间存在关系。
科尔莫戈罗夫-斯米尔诺夫试验
Kolmogorov-Smirnov检验(也称为K-S检验)是以俄罗斯数学家Andrey Kolmogorov和Nikolai Smirnov的名字命名的一种统计方法,用于确定样本是否来自人群中的特定分布。建议用于大样本(如2000年以上)的Kolmogorov-Smirnov检验是非参数的,这意味着它不依赖于任何有效的分布。其目的是证明正态分布样本的零假设。
与卡方检验相反,Kolmogorov-Smirnov检验适用于连续分布。与卡方检验一样,它使用了一个无效的替代假设和一个α水平的显著性。Null表示数据在总体中遵循特定的分布,alternative表示数据在总体中没有遵循特定的分布。α用于确定试验中使用的临界值。
计算出的检验统计量,通常表示为D,决定是否接受或拒绝无效假设。如果D大于α处的临界值,则无效假设被拒绝。如果D小于临界值,则接受零假设,表明
希皮罗-威尔克试验
Shipiro-Wilk检验确定样本是否服从正态分布。使用具有一个连续数据变量的样本,Shipiro-Wilk检验只检查正态性。建议小于等于2000的小样本。与其他假设一样,它使用alpha并形成两个假设:空假设和替代假设。零假设说明样本来自正态分布,而替代假设说明样本不来自正态分布。
Shipiro-Wilk测试使用了一个叫做QQ图的概率图。这个散点图直观地显示了y轴上的两组分位数,从最小到最大排列。如果每个分位数来自相同的分布,散点图将显示一系列线性图。Shipiro-Wilk检验使用QQ图来估计方差。使用QQ图方差和估计的总体方差,可以确定样本是否属于正态分布。如果两个方差的商等于或接近1,则可以接受零假设。如果远远低于1,则可以拒绝。
拟合优度检验示例
例如,一个小型社区健身房可能在以下假设下运行:周一、周二和周六的上座率最高,周三和周四的平均上座率最低,周五和周日的上座率最低。基于这些假设,健身房每天雇佣一定数量的工作人员来为会员办理入住手续、清洁设施、提供培训服务和授课。
然而,健身房的财务状况不佳,老板想知道这些出勤率假设和人员配备水平是否正确。店主决定在六个星期内每天计算参加健身房的人数。然后,他可以用卡方拟合优度检验来比较健身房的假定出勤率和观察到的出勤率。有了新的数据,他可以决定如何最好地管理健身房,提高盈利能力。
拟合优度常见问题解答
拟合优度是什么意思?
拟合优度是一种统计假设检验,用于观察观察到的数据与预期数据的吻合程度。拟合优度检验可以帮助确定样本是否服从正态分布,分类变量是否相关,或者随机样本是否来自同一分布。
为什么拟合优度很重要?
拟合优度测试有助于确定观测数据是否符合预期。可以根据假设检验的结果做出决定。例如,一个零售商想知道什么产品对年轻人有吸引力。零售商对老年人和年轻人进行随机抽样调查,以确定哪种产品更受欢迎。通过卡方检验,他们发现产品a和年轻人之间存在着95%的置信度关系。根据这些结果,可以确定这个样本代表了年轻人的群体。零售营销人员可以利用这一点来改革他们的营销活动。
卡方检验中的拟合优度是什么?
卡方检验分类变量之间是否存在关系,样本是否代表整体。它估计观察到的数据与预期数据的反映程度,或者它们的拟合程度。
你怎么做拟合优度测试?
拟合优度检验由不同的检验方法组成。测试的目标将有助于确定使用哪种方法。例如,如果目标是在相对较小的样本上检验正态性,Shipiro-Wilk检验可能是合适的。如果想要确定样本是否来自人群中的特定分布,将使用Kolmogorov-Smirnov检验。每个测试都使用自己独特的公式。然而,他们有共同点,如一个无效的假设和水平的意义。
底线
拟合优度检验确定样本数据与总体期望值的拟合程度。从样本数据中收集观察值,并使用差异度量将其与计算的期望值进行比较。有不同的拟合优度假设测试,取决于你所寻求的结果。
选择合适的拟合优度检验很大程度上取决于你想知道的关于样本的信息以及样本的大小。例如,如果想知道分类数据的观察值是否与分类数据的预期值匹配,请使用卡方检验。如果想知道小样本是否服从正态分布,Shipiro-Wilk检验可能是有利的。有许多测试可用于确定拟合优度。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论