既然加入激活函数是为了加入非线性因素,那么为什么可以使用ReLu呢?

发布于 2022-09-07 16:23:38 字数 91 浏览 21 评论 0

1、max(0,x)的话在大于0的区间就是线性的,这样还能起到加入非线性元素的作用吗?
2、leaky ReLU作为ReLU的进阶版为什么并没有比ReLu常用呢?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

风启觞 2022-09-14 16:23:38

ReLu虽然在大于0的区间是线性的,在小于等于0的部分也是线性的,但是它整体不是线性的,因为不是一条直线

多个线性操作的组合也是一个线性操作,没有非线性激活,就相当于只有一个超平面去划分空间。但是ReLu是非线性的,效果类似于划分和折叠空间,组合多个(线性操作 + ReLu)就可以任意的划分空间。

clipboard.png

很多ReLU改进版:leaky relu、prelu、elu、crelu……各有各的效果和性能,都不比为relu常见:

  1. 不一定有效,例如没遇到dying relu,就没必要用leaky relu,用了也不一定会更好
  2. 更复杂、性能不如relu

参考:

  1. How Do Neural Networks Work?
山人契 2022-09-14 16:23:38

同意楼上的回答,再补充一点吧:
关于线性非线性的解释:在数学中,函数是线性函数,那么这个函数就是一条直线;而剩下的所有情况都属于非线性函数。
根据以上定义,折线也不属于线性函数,而Relu就是折线的一种,所以就是非线性了。。

怀中猫帐中妖 2022-09-14 16:23:38

线性是指所有变量的最高次幂最大为1, 比如3x + 5y就是线性的,3x^2 + 5y就不是线性的了

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文