剪枝决策树

发布于 2024-12-27 09:44:50 字数 101 浏览 6 评论 0原文

当训练集中的示例太少时，如何使用 ID3 修剪决策树构建。

我无法将其分为训练集、验证集和测试集，所以这是不可能的。

有没有可以使用的统计方法或类似的方法？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

预谋 2025-01-03 09:44:50

是的，当您的数据量较少时，可以使用交叉验证来训练和修剪您的数据集。这个想法相当简单。您将数据分为 N 组，并用其中的 N-1 组训练您的树。您用作修剪测试集的最后一组。然后你从 N 组中选择另一组省略，并做同样的事情。重复此操作，直到排除所有组。这意味着您将构建 N 棵树。您将使用这 N 棵树来计算树的最佳大小，然后使用计算结果对完整数据集进行训练以修剪该树。它比我在这里可以有效描述的更复杂，但这里有一篇关于如何使交叉验证适应 ID3 的文章。

决策树交叉验证

已经进行了大量研究交叉验证的正确分段，并且发现 N=10 在给定的额外处理时间下给出了最佳结果。交叉验证会大大增加计算时间（N倍），但是当数据量较小时，它可以克服样本数量较少的问题。由于您没有大量数据，这意味着使用交叉验证在计算上并不是那么糟糕。

回复收藏 0 原文

~没有更多了~