我尝试对部分数据集进行预测,但为什么它继续对整个数据集进行预测?
因此,我在 R 中针对 65OOO 行构建了一个 lm 模型,并且我只想查看前十行的预测,以便了解模型的预测效果如何。下面您可以看到我编写的执行此操作的代码,但它不断预测所有 65000 行的值。有人能帮助我吗?
test_data <- mydata[1:10,]
test_data<-subset(test_data,select = -c(24)) #delete column which i try to predict
predict(lm_model109,new=test_data)
So I build a lm model in R on 65OOO rows and I want to see only the predictions for the first ten rows in order to see how good my model predicts. Below you can see the code I wrote to execute this but it keeps predicting the values of all 65000 rows. Is someone able to help me?
test_data <- mydata[1:10,]
test_data<-subset(test_data,select = -c(24)) #delete column which i try to predict
predict(lm_model109,new=test_data)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您需要使用“newdata”而不是“new”一词。它只是忽略带有错误的那一行并预测训练数据,因此预测(lm_model109,newdata = test_data)
you need to use the words newdata and not new. It just ignores that line with the error and predicts the training data so predict(lm_model109,newdata=test_data)