Scikit Learn DecisionTreeRegressor 算法不一致

发布于 2025-01-17 04:10:40 字数 142 浏览 2 评论 0原文

我目前正在使用决策树（使用 Scikit Learn DecisionTreeRegressor）来拟合回归树。我面临的问题是，使用与 6 个月前相同的数据的算法，输出（即最佳分割点）略有变化。我的猜测是，他们计算 mse 标准或类似标准的方式可能略有改变。有人知道吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

意犹 2025-01-24 04:10:40

DecisionTreeRegressor 表现出随机行为，除非您指定 random_state 作为构造函数的参数。

random_state 的详细信息>文档解释了随机性可能影响你的执行的地方 - 特别参见我突出显示的粗体部分：

random_state int，RandomState 实例或 None，默认=None
控制估计器的随机性。即使拆分器设置为“最佳”，特征在每次拆分时始终会随机排列。当 max_features n_features，算法将在每次分割时随机选择 max_features，然后找到其中的最佳分割。但即使 max_features=n_features，找到的最佳分割也可能因不同的运行而异。如果标准的改进对于多个分割是相同的并且必须随机选择一个分割，则情况就是这样。 为了在拟合期间获得确定性行为，random_state 必须固定为整数。有关详细信息，请参阅术语表。