为什么用直方图树方法构建的XGBoost BDT模型取决于训练数据排序？

发布于 2025-01-30 11:45:09 字数 327 浏览 4 评论 0原文

我正在使用Python Xgboost在某些数据（总共50K）上训练某些模型（具有二进制逻辑），并且我使用了训练的直方图树方法（tree_method =“ hist”）。我整理了数据中的事件，并将它们用于培训。事实证明，根据事件的顺序，构建的模型略有不同，并且基于相应的验证集（与训练集不同）的相应预测的结果可能会有所不同5％。作为双检查，我还使用了LightGBM，并且还提出了这种效果。看来这是直方图方法的问题，因为如果我在xgboost中使用确切的方法（tree_method =“ extcres”），那么此问题就会消失。

有人知道为什么基于直方图方法的BDT模型取决于事件顺序吗？我试图寻找参考纸，但完全丢失了。

原文

分享到QQ

分享到微博