如何在 R 中操作 GLM 系数？

发布于 2024-12-11 22:32:40 字数 1224 浏览 0 评论 0原文

如何操作 GLM 对象来绕过此错误？我希望预测将看不见的水平视为基本情况（即，给它们系数为零。）

> master <- data.frame(x = factor(floor(runif(100,0,3)), labels=c("A","B","C")), y = rnorm(100))
> part.1 <- master[master$x == 'C',]
> part.2 <- master[master$x == 'A' | master$x == 'B',]
> model.2 <- glm(y ~ x, data=part.2)
> predict.1 <- predict(model.2, part.1)
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) : factor 'x' has new level(s) C

我尝试这样做：

> model.2$xlevels$x <- c(model.2$xlevels, "C")
> predict.1 <- predict(model.2, part.1)

但它没有正确对模型进行评分：

> predict.1[1:5]
         2          3          6          8         10 
0.03701494 0.03701494 0.03701494 0.03701494 0.03701494 
> summary(model.2)

Call:
glm(formula = y ~ x, data = part.2)
<snip>
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  0.12743    0.18021   0.707    0.482
xB          -0.09042    0.23149  -0.391    0.697

predict.1 应该仅为 0.12743。

这显然只是一个精简版本 - 我的真实模型中有 25 个左右的变量，因此 predict.1 <-rep(length(part.1), 0.12743) 的答案是对我没用。

感谢您的帮助！

原文

How can I manipulate a GLM object in order to bypass this error? I would like for predict to treat the unseen levels as base cases (that is, give them a coefficient of zero.)

> master <- data.frame(x = factor(floor(runif(100,0,3)), labels=c("A","B","C")), y = rnorm(100))
> part.1 <- master[master$x == 'C',]
> part.2 <- master[master$x == 'A' | master$x == 'B',]
> model.2 <- glm(y ~ x, data=part.2)
> predict.1 <- predict(model.2, part.1)
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) : factor 'x' has new level(s) C

I tried doing this:

> model.2$xlevels$x <- c(model.2$xlevels, "C")
> predict.1 <- predict(model.2, part.1)

But it's not scoring the model correctly:

> predict.1[1:5]
         2          3          6          8         10 
0.03701494 0.03701494 0.03701494 0.03701494 0.03701494 
> summary(model.2)

Call:
glm(formula = y ~ x, data = part.2)
<snip>
Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  0.12743    0.18021   0.707    0.482
xB          -0.09042    0.23149  -0.391    0.697

predict.1 should only be 0.12743.

This is obviously just a trimmed down version--my real model has 25 or so variables in it, so an answer of predict.1 <- rep(length(part.1), 0.12743) is not useful to me.

Thanks for any help!

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

方圜几里 2024-12-18 22:32:40

如果您知道 x=='C' 的观察结果与 x=='A' 的行为完全相同，那么您可以这样做：

> part.1$x <- factor(rep("A",nrow(part.1)),levels=c("A","B"))
> predict(model.2, part.1)

这将为您提供纯截距模型。

If you know that observations where x=='C' behave exactly like x=='A', then you can just do:

> part.1$x <- factor(rep("A",nrow(part.1)),levels=c("A","B"))
> predict(model.2, part.1)

which will give you your pure intercept model.

回复收藏 0 原文

弄潮 2024-12-18 22:32:40

我不同意你应该期待任何预测。您开发的模型不包含 x 变量是值为“C”的因子的项目，因此您不应期望任何预测。您对 1:5 进行预测的努力也应该会失败。

回复收藏 0 原文

~没有更多了~

关于作者

审判长

暂无简介

0 文章

0 评论

22 人气

关注发私信

尘世孤行

文章 0 评论 0

关注

烟─花易冷

文章 0 评论 0

关注

你是年少的欢喜

文章 0 评论 0

关注

倒带

文章 0 评论 0

关注

忱杏

文章 0 评论 0

关注

送君千里

文章 0 评论 0

友情链接

文江博客

如何在 R 中操作 GLM 系数？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

尘世孤行

烟─花易冷

你是年少的欢喜

倒带

忱杏

送君千里

友情链接

如何在 R 中操作 GLM 系数？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

尘世孤行

烟─花易冷

你是年少的欢喜

倒带

忱杏

送君千里

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。