当前位置：文江博客话题详情

machine-learning neural-network backpropagation deep-learning

神经网络加权

发布于 2024-10-03 00:37:53 字数 225 浏览 16 评论 0原文

最近我研究了反向传播网络并做了一些手动练习。之后，我提出了一个问题（也许没有意义）：遵循两种不同的替换方法有什么重要的吗： 1. 增量训练：一旦知道所有 delta Wij 并在呈现下一个训练向量之前，权重就会立即更新。 2. 批量训练：计算并存储每个样本训练向量的 delta Wij。然而，Delta Wij 不会立即用于更新权重。权重更新是在训练周期结束时完成的。

我用谷歌搜索了一段时间但没有找到任何结果。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

流星番茄 2024-10-10 00:37:53

所以你指的是执行梯度下降学习的两种模式。在批处理模式下，权重矩阵的变化在训练数据集的整个呈现过程中累积（一个“时期”）；在线训练在呈现包含训练集的每个向量后更新权重。

我相信人们的共识是在线培训更优越，因为它收敛得更快（大多数研究报告在准确性方面没有明显差异）。（例如，参见 Randall Wilson 和 Tony Martinez，梯度下降学习批量训练的一般低效率，神经网络 (2003)。

在线训练收敛速度更快的原因其实际意义在于，您可以使用更大的学习率（因此可以通过训练数据以更少的周期收敛）

。训练随着训练集的大小而增加，结果是批量训练在每次迭代时使用较大的步长，因此会错过误差空间拓扑中的局部最小值——您的求解器会振荡而不是收敛。

批量 ’（最常用于机器学习教科书等），只要它在可接受的时间限制内收敛，使用它就没有什么问题。同样，性能（分辨率或分类准确性）的差异很小或可以忽略不计。

回复收藏 0 原文

素染倾城色 2024-10-10 00:37:53

是的，这两种方法之间存在差异。计算出的增量是输入向量和网络权重的函数。如果更改权重，则根据下一个输入向量计算的增量将与未更改权重时不同。

因此，对于第一个输入向量，无论您选择哪种方法，都将计算相同的增量。现在，对于连续方法，网络中的权重将发生变化，而在同步方法中，权重暂时保持不变。当出现第二个输入向量时，两种方法现在都会产生不同的增量，因为两个网络之间的权重不同。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

隔纱相望

文章 0 评论 0

昵称有卵用

文章 0 评论 0

梨涡

文章 0 评论 0

蓝咒

文章 0 评论 0

白芷

文章 0 评论 0

樱娆

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文