在 R 中构建分类树时,如何解释因子变量上的 rpart 分割?
如果因子变量是气候,有 4 个可能的值:热带、干旱、温带、雪,并且我的 rpart
树中的一个节点标记为“Climate:ab”,那么分割是什么?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
如果因子变量是气候,有 4 个可能的值:热带、干旱、温带、雪,并且我的 rpart
树中的一个节点标记为“Climate:ab”,那么分割是什么?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
我假设您使用标准方法来绘制树,正如
您可以在
text.rpart
的帮助中阅读的那样,默认因子变量上的参数pretty
显示为字母,因此a
表示levels(Climate)[1]
,表示在左侧节点上观察Climate==levels(Climate)[1]
和 on正确对待其他人。您可以使用
直接打印关卡,但我建议使用 draw.tree href="http://cran.r-project.org/web/packages/maptree/index.html" rel="noreferrer">maptree 包:
我使用假数据来做图:
I assume you use standard way to plot tree which is
As you can read in help to
text.rpart
, argumentpretty
on default factor variables are presented as letters, soa
meanslevels(Climate)[1]
and it means that on left node are observation withClimate==levels(Climate)[1]
and on right the others.You could print levels directly using
but I recommend using
draw.tree
from maptree package:I used fake data to do plots: