对大面积空值的数据预处理是怎么进行的?
对于缺失值基本有删除、填充和重构变量等做法,但是具体的操作是怎么进行的呢?比方说你当你并不清楚各个字段的含义时:
1.如何认定该字段与模型无关、缺失值的比例达到多少就可以删除?
2.什么时候会认为缺失值也是一种有用的状态?
3.什么时候需要进行数据填充?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
方法还是挺多的。
我找到几个链接,附在下面,应该对你有帮助。
训练集中有的特征含有缺失值,一般怎么处理
如何判断缺失值是否是随机的缺失?
請問怎麼用。