非参数统计:概述 编辑
什么是非参数统计?
非参数统计是指一种统计方法,在这种方法中,数据不假定来自由少量参数确定的规定模型;此类模型的示例包括正态分布模型和线性回归模型。非参数统计有时使用序数数据,这意味着它不依赖于数字,而是依赖于排序或排序。例如,一项传达消费者从喜欢到不喜欢的偏好的调查将被视为有序数据。
非参数统计包括非参数统计描述性统计统计模型、推论和统计检验。未指定非参数模型的模型结构先验的而是由数据决定的。术语非参数 并不是说这种模型完全没有参数,而是说参数的数量和性质是灵活的,不是预先固定的。直方图是概率分布的非参数估计的一个例子。
关键要点
- 非参数统计很容易使用,但不能提供其他统计模型的精确性。
- 这种类型的分析通常最适合考虑事物的顺序,即使数值数据发生变化,结果也可能保持不变。
理解非参数统计
在统计学中,参数统计包括均值、标准差、皮尔逊相关、方差等参数。这种统计形式使用观测数据来估计分布的参数。在参数统计下,通常假设数据来自具有未知参数μ(总体均值)和σ2(总体方差)的正态分布,然后使用样本均值和样本方差进行估计。
非参数统计对样本量和观测数据是否定量不作任何假设。
非参数统计不假定数据来自正态分布。相反,分布的形状是在这种统计测量形式下估计的。虽然在许多情况下可以假设正态分布,但也有一些情况下,真实的数据生成过程远远不是正态分布的。
非参数统计实例
在第一个例子中,考虑一位金融分析师,他希望估计一项投资的风险价值(VaR)。该分析师收集了100个类似投资在类似时间范围内的收益数据。她没有假设收益服从正态分布,而是使用直方图非参数地估计分布。这个直方图的第5个百分位数为分析员提供了VaR的非参数估计。
举第二个例子,考虑另一个研究者,他想知道平均睡眠时间是否与一个人生病的频率有关。因为很多人很少生病,如果有的话,偶尔也会有人比大多数人更经常生病,所以患病频率的分布显然是不正常的,是右偏的,容易出现异常值。因此,研究人员决定使用非参数方法,如分位数回归分析,而不是像经典回归分析那样,使用疾病频率服从正态分布的方法。
特别注意事项
非参数统计因其易用性而受到重视。随着对参数的需求减少,数据变得更适用于更多种类的测试。当没有任何相关信息可用时,这种类型的统计数据可以在没有平均值、样本量、标准差或任何其他相关参数估计的情况下使用。
由于非参数统计对样本数据的假设较少,其应用范围比参数统计更广。在参数测试更合适的情况下,非参数方法的效率会更低。这是因为与参数统计不同,非参数统计丢弃了数据中可用的一些信息。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论