随机森林重要特征输出稳定性问题

发布于 2025-02-13 16:23:01 字数 232 浏览 2 评论 0原文

我拟合2 几乎相同的随机森林回归模型。两种模型都使用具有60个功能和90个数据点的相同数据集。唯一的区别是他们使用不同的目标（当然，每个模型的目标列被排除在相应的功能范围之外）。在两个模型（折叠数，迭代次数，评分数）中，所有交叉验证设置均相同，并且超参数网格也相同。

我对功能重要性输出感兴趣。但是，其中一个模型始终输出相同的顶部功能，而另一个则没有输出。有人知道为什么是这种情况吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

挽你眉间 2025-02-20 16:23:02

您可以设置 seed 或参数 random_state ，以防您依靠sklearn.ensemble.randomforestregressor来稳定结果。

由于森林是随机组装的，因此具有不同特征的重要性是很正常的。此外，特征重要性可能不是评估实际特征重要性的最佳指标。您可以尝试Boruta-Algorithm/置换功能以获取不同的观点。

在您的实际问题上，也许您的回归器更适合预测一个目标变量另一个目标变量。
两种模型如何在数据上执行精确度？这可能是解释为什么一种模型更稳定的一种可能性。对于安装大量的树木而言，特征的重要性仍然不稳定吗？

回复收藏 0 原文

~没有更多了~

关于作者

塔塔猫

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

随机森林重要特征输出稳定性问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

882123719

朦胧时间

alipaysp_DQOPIT9H5Y

眼藏柔

微信用户

寻梦旅人

友情链接

随机森林重要特征输出稳定性问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

882123719

朦胧时间

alipaysp_DQOPIT9H5Y

眼藏柔

微信用户

寻梦旅人

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。