返回介绍

数学基础

统计学习

深度学习

工具

Scala

集成学习

发布于 2023-07-17 23:38:26 字数 952 浏览 0 评论 0 收藏 0

  1. 集成学习ensemble learning是通过构建并结合多个学习器来完成学习任务。其一般结构为:

    • 先产生一组“个体学习器”(individual learner) 。个体学习器通常由一种或者多种现有的学习算法从训练数据中产生。

      • 如果个体学习器都是从某一种学习算法从训练数据中产生,则称这样的集成学习是同质的homogenerous

        此时的个体学习器也称作基学习器base learner,相应的学习算法称作基学习算法。

      • 如果个体学习器是从某几种学习算法从训练数据中产生,则称这样的集成学习是异质的heterogenous

    • 再使用某种策略将它们结合起来。集成学习通过将多个学习器进行组合,通常可以获得比单一学习器显著优越的泛化性能。

  2. 通常选取个体学习器的准则是:

    • 个体学习器要有一定的准确性,预测能力不能太差。
    • 个体学习器之间要有多样性,即学习器之间要有差异。
  3. 通常基于实际考虑,往往使用预测能力较强的个体学习器(即强学习器,与之对应的为弱学习器)。

    强学习器的一个显著的好处就是可以使用较少数量的个体学习器来集成就可以获得很好的效果。

  4. 根据个体学习器的生成方式,目前的集成学习方法大概可以分作两类:

    • 个体学习器之间存在强依赖关系、必须串行生成的序列化方法,每一轮迭代产生一个个体学习器。其中以Boosting为代表。
    • 个体学习器之间不存在强依赖关系、可同时生成的并行化方法。其中以Bagging和随机森林Random Forest为代表。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文