样本选择偏差 编辑
什么是样本选择偏差?
样本选择偏差是由于选择非随机数据进行统计分析而产生的一种偏差。偏差是由于样本选择过程中的缺陷而存在的,其中数据的子集由于特定属性而被系统地排除在外。排除子集可能会影响检验的统计显著性,并且会使统计模型参数的估计值产生偏差。
了解样本选择偏差
生存偏差 是一种常见的样本选择偏差。例如,当对一大群股票的投资策略进行回测时,可以方便地查找具有整个样本期数据的证券。如果我们要根据15年的股票数据来测试策略,我们可能倾向于寻找在整个15年期间拥有完整信息的股票。然而,剔除一只停止交易或很快离开市场的股票,将在我们的数据样本中输入一个偏差。由于我们只考虑了持续15年的股票,我们的最终结果将是有缺陷的,因为这些股票表现良好,足以在市场中生存。
对冲基金 绩效指标是样本选择偏差受生存偏差影响的一个例子。由于无法存活的对冲基金停止向指数聚合器报告其业绩,因此产生的指数自然倾向于保留下来的基金和策略,因此“存活”。这也可能是受欢迎的共同基金报告服务的一个问题。
分析师可以调整以考虑这些偏见,但可能会在这个过程中引入新的偏见
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论